小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了JoyVASA框架，解决了音频驱动肖像动画模型在训练效率和视频时长上的限制。通过解耦动态面部表情与静态3D表示，JoyVASA能够生成更长的视频并实现动物面部动画，实验结果表明其在动画质量和保真度上具有显著优势。

JoyVASA: Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation for Portrait and Animal Image Animation

BriefGPT - AI 论文速递 ·

本文研究了动态面部表情识别中的情境影响，提出了一种整体理解场景的识别方法（OUS），有效整合场景与面部特征，提升识别性能。该方法在多个数据集上优于现有技术，解决了表情变化和数据不确定性的问题，具有更强的泛化能力和鲁棒性。

寻求不确定性中的确定性：双阶段统一框架解决动态面部表情识别中的不确定性

BriefGPT - AI 论文速递 ·