小红花·文摘

本文介绍了一种基于声音分解学习的方法，旨在提升音频驱动的视频生成性能，生成更逼真的面部动画。研究提出了情感视频肖像系统和可控面部动作的谈话面孔生成框架，实现高保真度的面部表情和唇部同步，且在多项指标上超越现有技术。