小红花·文摘

本文提出了一种协作混合传播框架（Co-Prop），旨在解决音视频分割中音频线索与分割结果时间不协调的问题。该方法通过音频边界锚定和逐帧音频插入传播，显著提升了多个数据集上的性能，并能与现有方法无缝集成。

BriefGPT - AI 论文速递 ·

EMO是一个新颖的框架，通过关注音频线索和面部动作之间的关系，解决了提高说话视频生成中的真实感和表现力的挑战。EMO能够产生高度表现力和逼真的动画，不仅能生成令人信服的说话视频，还能以各种风格生成唱歌视频。实验结果表明，EMO在表现力和逼真度方面优于现有方法学。

BriefGPT - AI 论文速递 ·