3DFacePolicy:基于语音驱动的扩散策略三维面部动画
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究提出了一种使用扩散模型和基于Transformer的轻量级U-Net实现的语音驱动的3D面部动画方法,通过交叉模态对齐偏差和引入BlendVOCA数据集来增强唇部同步性,并简化动画编辑过程。实验结果表明,该方法在唇部同步性上与基线方法相当或更出色。
🎯
关键要点
- 提出了一种使用扩散模型和基于Transformer的轻量级U-Net实现的语音驱动的3D面部动画方法。
- 引入音频和视觉之间的交叉模态对齐偏差以增强唇部同步性。
- 通过引进BlendVOCA数据集解决公共资源稀缺问题。
- 实验结果表明,该方法在唇部同步性上与基线方法相当或更出色。
- 该方法确保了更多样化的唇部运动,并简化了动画编辑过程。
🏷️