小红花·文摘

本文介绍了一种基于音频驱动的三维面部动画模型，采用交叉模态学习和多语种增强技术，提升了面部表情的同步性和生成质量。该模型具有良好的泛化能力，能够捕捉个体的讲话风格，适用于游戏和虚拟现实等领域。实验结果表明，其在唇语同步和动画质量方面优于现有方法。

BriefGPT - AI 论文速递 ·

本文介绍了一种改善语音驱动的三维面部动画的方法，通过考虑面部运动的复合性和局部性，使用自适应调制模块来实现动画的改进。同时，提出了一种非自回归骨干结构将音频转化为三维面部动作。该方法在定性和定量上优于当代最先进的方法。

BriefGPT - AI 论文速递 ·