利用大型语言模型和布局到图像合成提升小样本检测
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对现有小样本检测中数据增强效果有限的问题,提出了一种新的协作框架,通过结合大型语言模型和布局到图像合成模型,以提升小样本检测的方法。研究显示,此方法在COCO小样本基准测试中的mAP表现显著提升,证明了在生成式增强方法中的有效性和创新性。
本文介绍了ZestGuide,这是一种用于文本生成图像的零样本分割指导方法。通过结合自然语言和空间控制,ZestGuide可以嵌入预训练的文本到图像扩散模型中。实验结果显示,在COCO数据集上,该方法在对齐精度和图像质量上优于Paint with Words。