个性化的改写提示增强文本生成图像
原文中文,约500字,阅读约需2分钟。发表于: 。我们提出了一种将大型预训练模型视为搜索引擎的新视角,从而使以前用于提高搜索引擎性能的技术得以重新应用。通过个性化查询重写技术的示例,我们在文本到图像生成领域使用了这种视角。尽管该领域取得了显著进展,但仍然很难创建与个体用户的期望和偏好密切对齐的个性化视觉表示。这个过程需要用户用对模型理解且准确捕捉他们的愿景的文字来表达,这对许多用户来说很困难。在本文中,我们通过利用用户与系统的历史互动来提高...
该研究将大型预训练模型视为搜索引擎,通过个性化查询重写技术解决了创建个性化视觉表示的挑战。研究提出了一种基于大规模文本到图像数据集的用户提示重写方法,实验证明了其优越性。