NoiseCollage: 一种基于噪声裁剪和合并的布局感知文本到图像扩散模型
原文中文,约300字,阅读约需1分钟。发表于: 。本研究提出了一种新颖的布局感知的文本到图像扩散模型 NoiseCollage,它通过独立估计噪音并将其裁剪和合并为单个噪音,从而解决了文本和布局条件之间存在的不匹配以及生成图像质量下降的问题。定性和定量评估结果表明,NoiseCollage 优于几种最新模型,这些成功的结果表明使用噪音的裁剪和合并操作是一种合理的图像生成策略。还展示了将 NoiseCollage 与 ControlNet...
本研究提出了一种新颖的布局感知的文本到图像扩散模型NoiseCollage,解决了文本和布局条件不匹配的问题。实验结果表明,NoiseCollage优于其他模型,并展示了与ControlNet集成的效果。