ComFusion: 多个特定场景中的个性化主题生成 单图像
原文中文,约500字,阅读约需2分钟。发表于: 。最近在个性化文本到图像(T2I)扩散模型方面的进展表明,使用有限数量的用户提供的示例生成基于个性化视觉概念的图像的能力已被证明。然而,这些模型在维护高视觉保真度方面经常遇到困难,特别是在根据文本输入进行场景操作时。为了解决这个问题,我们引入了...
最近的研究发现,个性化文本到图像(T2I)扩散模型在生成高保真度图像方面存在困难。研究人员提出了一种名为ComFusion的新方法,能够将视觉主题实例与文本特定场景融合,生成高保真度的实例。ComFusion使用预训练模型和场景特定知识来提高生成的保真度,并确保图像与实例和场景文本对齐。对T2I个性化中的各种基线进行了评估,证明了ComFusion的优越性。