个性化的改写提示增强文本生成图像
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
该研究将大型预训练模型视为搜索引擎,通过个性化查询重写技术解决了创建个性化视觉表示的挑战。研究提出了一种基于大规模文本到图像数据集的用户提示重写方法,实验证明了其优越性。
🎯
关键要点
- 该研究将大型预训练模型视为搜索引擎,重新应用提高搜索引擎性能的技术。
- 通过个性化查询重写技术,解决了创建个性化视觉表示的挑战。
- 个性化视觉表示需要用户用准确的文字表达其愿景,但许多用户对此感到困难。
- 研究利用用户与系统的历史互动来提高用户提示的质量。
- 提出了一种基于超过300k个提示的3115个用户的新大规模文本到图像数据集的用户提示重写方法。
- 重写模型增强了用户提示与预期视觉输出之间的表达和对齐。
- 实验证明了该方法的优越性,支持了新离线评估方法和在线测试。
- 该方法为应用更多搜索引擎技术构建个性化的大型预训练模型提供了新可能性。
➡️