迭代组合感知反馈学习模型画廊用于文本到图像生成
原文中文,约200字,阅读约需1分钟。发表于: 。本研究针对现有文本到图像生成模型在组合生成能力上的不足,提出了IterComp,一个结合多模型优劣的框架。通过引入迭代反馈学习方法,IterComp显著改善了在多类别物体组合和复杂语义对齐任务上的表现,开辟了扩展扩散模型及组合生成的新研究方向。
本文介绍了一种新的评分扩散模型条件化方法,分析了组合失败的原因,并提出了解决方案。通过能量参数化模型和新的组合算子,结合复杂的Metropolis修正取样器,在多个领域提升了组合生成效果。