3DFacePolicy:基于语音驱动的扩散策略三维面部动画

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该研究提出了一种使用扩散模型和基于Transformer的轻量级U-Net实现的语音驱动的3D面部动画方法,通过交叉模态对齐偏差和引入BlendVOCA数据集来增强唇部同步性,并简化动画编辑过程。实验结果表明,该方法在唇部同步性上与基线方法相当或更出色。

🎯

关键要点

  • 提出了一种使用扩散模型和基于Transformer的轻量级U-Net实现的语音驱动的3D面部动画方法。
  • 引入音频和视觉之间的交叉模态对齐偏差以增强唇部同步性。
  • 通过引进BlendVOCA数据集解决公共资源稀缺问题。
  • 实验结果表明,该方法在唇部同步性上与基线方法相当或更出色。
  • 该方法确保了更多样化的唇部运动,并简化了动画编辑过程。