该研究提出了一种使用扩散模型和基于Transformer的轻量级U-Net实现的语音驱动的3D面部动画方法,通过交叉模态对齐偏差和引入BlendVOCA数据集来增强唇部同步性,并简化动画编辑过程。实验结果表明,该方法在唇部同步性上与基线方法相当或更出色。
完成下面两步后,将自动完成登录并继续当前操作。