Portrait4D-v2:伪多视角数据创造更好的 4D 头部合成器
原文中文,约300字,阅读约需1分钟。发表于: 。通过使用伪多视图视频,我们提出了一种新颖的学习方法,用于前馈一次性 4D 头像合成,并利用运动感知交叉注意力的简单视觉转换器骨干,我们的方法在重建保真度、几何一致性和运动控制精度方面具有优于先前方法的性能。
本研究提出了一种新颖的3D感知说话人视频动作迁移网络Head3D,通过生成可视化可解释的3D标准头部,从2D主体帧中充分利用主体外貌信息,以适应驱动视频帧对齐。实验证明Head3D在跨身份设置中优于2D和3D先前方法,能够轻松适应受控姿态的新视图合成任务。