本文介绍了DFRT方法,用于few-shot声音驱动下的面部融合。该方法使用2D图像学习面部先验知识,并可应用于新的身份。同时,提出了可微的面部扭曲模块以更好地建模面部变形。实验结果表明,该方法能够在短时间内生成高质量的自然音频驱动视频。
完成下面两步后,将自动完成登录并继续当前操作。