EMMA: 您的文本到图像扩散模型可秘密接受多模态提示
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究旨在通过软提示个性化文本到图像扩散模型,创造具有足够变化的新实例。解决方案允许模型学习一组软提示,并生成新的图像。研究还展示了提示分布对其他任务的适应性,并证明了方法的有效性。
🎯
关键要点
- 本研究通过软提示个性化文本到图像扩散模型。
- 研究旨在从一组参考图像中创造具有变化的新实例。
- 解决方案允许模型学习一组软提示以生成新图像。
- 提示提供文本引导的编辑能力,增加了灵活性。
- 所学提示分布对其他任务(如文本到3D转换)具有适应性。
- 通过自动评估和人工评估证明了方法的有效性。
➡️