该研究通过微调预训练文本到图像扩散模型中的文本嵌入,实现了低成本的自然多概念文本到图像生成,并在扩散步骤中不增加附加的训练或推理成本。该方法通过收集与最相似的令牌的语义特征来定位贡献,并应用交叉令牌非极大值抑制来避免不同概念之间的特征混合,从而在文本到图像、图像操作和个性化任务中优于以前的方法。
该研究提出了一种低成本的自然多概念文本到图像生成解决方案,通过微调预训练文本到图像扩散模型中的文本嵌入,应用交叉令牌非极大值抑制来避免不同概念之间的特征混合,优于以前的方法。
完成下面两步后,将自动完成登录并继续当前操作。