定制文本图像扩散与摄像机视角控制
原文中文,约500字,阅读约需2分钟。发表于: 。模型定制将新概念引入现有的文本 - 图像模型,实现新概念在新颖语境中的生成,然而,这种方法在对象的相机视图控制方面缺乏精确性,用户必须采用指示性工程(例如添加 “俯视图”)来实现粗略的视图控制。在这项工作中,我们引入了一项新任务 --...
这篇文章介绍了一种新的模型定制方法,可以通过文本提示来控制模型的相机视角。通过修改对象属性和引入目标相机姿态,可以在不同的背景场景中生成新概念的图像。为了解决二维和三维表示之间的差距,作者提出了一种二维扩散过程的条件设置方法。实验证明,这种方法在保留对象身份的同时,比现有的图像编辑和模型个性化方法更好地遵循输入文本提示和相机姿态。