跳跃与播放:面向任意对象的深度驱动姿态保持图像生成
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了现有图像生成模型在姿态控制上的局限性,尤其对多样化对象和姿态的应用。通过提出深度基础的姿态控制方法Skip-and-Play,研究表明该方法能够有效减少形状依赖性,同时保持生成图像的姿态。实验结果显示,Skip-and-Play在生成多样对象和姿态的能力上远超传统方法,具有显著的应用潜力。
本研究将3D可变模型整合到多视角一致性扩散方法中,提高了生成扩散模型在创建人类头像任务中的质量和功能。实验证明了该方法在新视角合成任务上的性能改进,并实现了面部表情和身体姿势控制的无缝融入。该框架是第一个允许从单一图像创建完全3D一致、可动画和照片般逼真的人类头像的扩散模型。定量和定性评估证明了该方法相对于现有模型的优势。