小红花·文摘

本研究提出FADA方法，解决音频驱动对话头像的慢推理速度问题。通过混合监督损失和多CFG蒸馏，FADA显著提高了模型的稳健性和推理速度，速度提升可达4.17-12.5倍，生成效果媲美最新扩散模型。