多概念 T2I-Zero:仅调整文本嵌入,不涉及其他部分
原文中文,约300字,阅读约需1分钟。发表于: 。通过对预训练文本到图像扩散模型中的文本嵌入进行微调,我们设计了一种低成本的解决方案,实现自然多概念文本到图像生成,并在扩散步骤中不增加附加的训练或推理成本。我们的方法通过收集与最相似的令牌的语义特征来定位贡献,并应用交叉令牌非极大值抑制来避免不同概念之间的特征混合,从而在文本到图像、图像操作和个性化任务中优于以前的方法。
该研究提出了一种低成本的自然多概念文本到图像生成解决方案,通过微调预训练文本到图像扩散模型中的文本嵌入,应用交叉令牌非极大值抑制来避免不同概念之间的特征混合,优于以前的方法。