Talk3D 是一种音频驱动的说话头合成框架,利用预训练的 3D 模型重建面部几何形状。该模型通过音频驱动的注意力 U-Net 架构,有效解耦音频无关特征,尤其在极端头部姿势下生成逼真面部几何形状表现优异。
Talk3D是一种新型音频驱动的说话头合成框架,能够高效重建面部几何形状。该模型采用音频驱动的注意力U-Net架构,在动态面部变化生成方面表现优异,尤其在极端头部姿势下。研究还提出了GeneFace和GeneFace++,实现高保真、实时的音频-唇形同步生成。其他方法如HiDe-NeRF和SyncTalk在面部表情和姿态的真实性上也取得了显著进展。
Talk3D 是一种新的音频驱动的说话头合成框架,通过有效地采用预训练的 3D 感知生成先验模型,可以忠实地重建其合理的面部几何形状。通过音频驱动的注意力 U-Net 架构,我们的模型预测 NeRF...
完成下面两步后,将自动完成登录并继续当前操作。