小红花·文摘

本文介绍了多种情感视频生成技术，如情感视频肖像(EVP)、EMOTE、DREAM-Talk和EmoTalker。这些系统通过音频与面部表情的结合，实现高质量的情感表达和唇部同步，显著提升了生成视频的真实感和表现力。研究表明，这些新方法在情感控制和动画生成方面优于传统技术。

EMOdiffhead：通过扩散在对话头生成中的连续情感控制

BriefGPT - AI 论文速递 ·

该研究提出了StyleSync框架，通过音频调制卷积精确修改嘴形，实现高保真的唇部同步。StyleLipSync模型能够从音频生成与身份无关的唇形视频，并采用姿态感知掩蔽和少量样本适应方法，显著提升同步效果。实验结果表明，该模型在唇形同步和视觉信息保留方面表现优异。

ReSyncer：基于风格生成器的统一音视频同步面部表演耠

BriefGPT - AI 论文速递 ·

本文介绍了一种创新的音频驱动3D说话头像生成技术，结合无表情3D模型与情感序列，创建了EmoVOCA数据集。研究者设计了情感3D说话头生成器，实现自然的面部表情和唇部同步，实验表明该方法在生成逼真动画方面表现优越，并引入后处理技术以增强动画真实性。

EmoTalk3D：情感 3D 说话头的高保真自由观察合成

BriefGPT - AI 论文速递 ·

该研究提出了Speech2Lip框架，通过学习音频与视觉的运动和外观，生成自然的对话面孔视频。该方法实现了高质量的唇部同步和视觉效果，适用于自动读唇和音频-视频检索任务。通过多模态运动空间和正交性约束，生成具有可控面部动作的谈话面孔，展现了在视觉质量和同步得分上的先进性能。

使你的演员说话：运动和外貌解耦的通用和高保真度的唇同步

BriefGPT - AI 论文速递 ·

本文提出了一种多语言对话生成系统，结合人脸生成和文本到语音技术，能够生成自然语音和同步口型。该系统通过规范空间和多模态运动空间，实现可控面部动作，生成高质量的交谈视频，视觉质量和唇部同步达到先进水平。同时，研究展示了基于文本的个性化面部表情生成方法，具有更高的真实性和自然性。

面部说话：从文本中联合合成说话脸部和语音

BriefGPT - AI 论文速递 ·

本文介绍了一种名为VividTalker的新方法，通过音频生成高质量的3D面部动画。该框架实现了自然的面部表情和准确的唇部同步，超越了现有技术，具有广泛的应用潜力。

AniTalker：通过身份解耦人脸动作编码实现生动多样的口型动画

BriefGPT - AI 论文速递 ·

本文介绍了一种基于声音分解学习的方法，旨在提升音频驱动的视频生成性能，生成更逼真的面部动画。研究提出了情感视频肖像系统和可控面部动作的谈话面孔生成框架，实现高保真度的面部表情和唇部同步，且在多项指标上超越现有技术。

EDTalk: 高效情感演讲头部合成

BriefGPT - AI 论文速递 ·

该论文提出了一种生成具有可控面部动作的谈话面孔的方法，通过建立规范空间和多模态运动空间，实现了外观自然、具有完全可控面部属性和准确的唇部同步。实验证明该方法在视觉质量和唇同步得分方面取得了最先进的结果。这是第一个开发出在生成的视频中准确展示包括唇部、头部姿势和眼动等所有目标面部运动的谈话面孔生成框架，没有超越 RGB 视频与音频的任何附加监督。

FaceChain-ImagineID: 从解耦音频中自由地构建高保真多样化的说话人脸

BriefGPT - AI 论文速递 ·

该论文提出了一种生成具有可控面部动作的谈话面孔的方法，通过建立规范空间和多模态运动空间，使用正交性约束分离身份和运动，实现了外观自然、具有完全可控面部属性和准确的唇部同步。实验证明，该方法在视觉质量和唇同步得分方面取得了最先进的结果，是第一个能够准确展示包括唇部、头部姿势和眼动等所有目标面部运动的谈话面孔生成框架，无需额外的RGB视频和音频监督。

CP-EB: 可控姿势和眨眼的对话人脸生成嵌入

BriefGPT - AI 论文速递 ·