本研究提出FADA方法,解决音频驱动对话头像的慢推理速度问题。通过混合监督损失和多CFG蒸馏,FADA显著提高了模型的稳健性和推理速度,速度提升可达4.17-12.5倍,生成效果媲美最新扩散模型。
完成下面两步后,将自动完成登录并继续当前操作。