小红花·文摘

Talk3D 是一种音频驱动的说话头合成框架，利用预训练的 3D 模型重建面部几何形状。该模型通过音频驱动的注意力 U-Net 架构，有效解耦音频无关特征，尤其在极端头部姿势下生成逼真面部几何形状表现优异。

NeRFFaceSpeech：一次性音频驱动的 3D 说话头合成基于生成先验

BriefGPT - AI 论文速递 ·

Talk3D是一种新型音频驱动的说话头合成框架，能够高效重建面部几何形状。该模型采用音频驱动的注意力U-Net架构，在动态面部变化生成方面表现优异，尤其在极端头部姿势下。研究还提出了GeneFace和GeneFace++，实现高保真、实时的音频-唇形同步生成。其他方法如HiDe-NeRF和SyncTalk在面部表情和姿态的真实性上也取得了显著进展。

高斯说话人：通过三维高斯喷洒合成特定说话人的形象

BriefGPT - AI 论文速递 ·