本文介绍了一种基于声音分解学习的方法,旨在提升音频驱动的视频生成性能,生成更逼真的面部动画。研究提出了情感视频肖像系统和可控面部动作的谈话面孔生成框架,实现高保真度的面部表情和唇部同步,且在多项指标上超越现有技术。
完成下面两步后,将自动完成登录并继续当前操作。