对比提示改善文本到图像扩散模型中的解缠
原文中文,约300字,阅读约需1分钟。发表于: 。通过对分类器的自由引导的简单修改,该论文展示了 Contrastive Guidance 方法可以帮助在文本到图像模型中解开图像因素,从而提供对图像因素更精细的控制。该方法的关键思想是使用两个仅在最小标记上有差异的提示对所需的因素进行描述,其中正面提示描述待合成的图像,基准提示作为 “基准”...
该论文介绍了Contrastive Guidance方法,通过对分类器的简单修改,在文本到图像模型中解开图像因素,提供更精细的控制。该方法使用两个提示来描述所需的因素,其中正面提示描述待合成的图像,基准提示作为“基准”以解开其他因素。该方法在三个场景下的优势体现为:领域特定扩散模型的训练、文本到图像生成的控制以及零-shot图像编辑器的性能提升。