小红花·文摘

本研究提出了一种新颖的3D感知说话人视频动作迁移网络Head3D，能够从2D主体帧中充分利用主体外貌信息，以适应驱动视频帧对齐。该方法能够生成可视化可解释的3D标准头部，并在跨身份设置中优于2D和3D先前方法。实验结果表明该方法能够轻松适应受控姿态的新视图合成任务。