最新的文本到图像扩散模型在生成高质量图像方面有进展,但在准确理解提示上有困难。为此,提出了一种无需训练的方法,通过在推理时调整模型的引导方向来改善语义对齐。具体做法是将提示分解为概念集,监控并调整每个概念的引导方向。实验显示,该方法有效提升了语义对齐能力。
最近的文本到图像扩散模型在生成高质量图像方面有进展,但在准确理解提示语义上存在问题。为此,提出了一种无需训练的方法,通过在推理时调整模型的引导方向来改善语义对齐。具体做法是将提示语义分解为概念集,监控并调整每个概念的引导方向。实验显示,该方法有效提升了语义对齐能力。
完成下面两步后,将自动完成登录并继续当前操作。