小红花·文摘

Nvidia 让任何人都可以使用其 AI 声音动画技术

The Verge ·

本研究综合评估了生成性人工智能在角色动画中的应用，分析了面部动画、表情渲染和图像合成等技术，指出了当前面临的挑战，并为未来研究方向提供指导。

Generative AI in Character Animation: A Comprehensive Survey of Techniques, Applications, and Future Directions

BriefGPT - AI 论文速递 ·

本研究提出了PC-Talk框架，旨在改善音频驱动的口语面孔生成中的面部动画控制，尤其是在唇音同步和情感表达方面。实验结果表明，该方法在HDTF和MEAD数据集上表现优异。

PC-Talk: Precise Facial Animation Control in Audio-Driven Talking Face Generation

BriefGPT - AI 论文速递 ·

人工智能使静态照片生动化，展现自然面部动画的开创性研究

DEV Community ·

本文介绍了一种基于3D可变形模型的语音驱动说话人脸合成方法，能够从视频中学习特征，生成自然的说话风格。研究提出了DFRT和Talk3D等新方法，利用少量数据和音频驱动生成高质量面部动画，解决个性化风格捕捉的挑战。实验结果表明，这些方法在生成真实感和表现力方面优于现有技术。

模仿谈话：在几分钟内模仿个性化和富有表现力的三维谈话面孔

BriefGPT - AI 论文速递 ·

本文介绍了一种基于音频信号生成个性化逼真说话动画的系统，提出了IMavatar、3D感知生成对抗网络和Myportrait等新方法。这些方法通过深度学习和3D模型整合，提升了面部动画的质量和一致性，成功解决了高质量动态脸部生成的挑战。

稳定的视频肖像

BriefGPT - AI 论文速递 ·

本文介绍了一种新颖的音频驱动面部动画生成方法，能够生成高质量的说话视频，确保唇语同步和丰富的面部表情。该方法通过多阶段框架和跨模态注意力技术，在生成质量和计算效率上优于现有技术，适用于实际应用。实验结果表明，其在个性化说话风格和视觉细节保持方面表现出色。

PersonaTalk：在视觉配音中突出你的角色

BriefGPT - AI 论文速递 ·

本文介绍了一种基于音频驱动的面部动画生成技术，涵盖姿势控制和情感表达。通过自监督学习和新模型，研究实现了高质量的嘴型同步和面部动态分解，提升了动画的自然性和准确性。EDTalk框架支持独立操作嘴型、姿势和情感，实验结果显示其性能优于现有技术。

PoseTalk：基于文本和音频的姿势控制与动作细化的一次性对话头生成

BriefGPT - AI 论文速递 ·

这个AI小玩物，让马斯克、川建国秒变「缺心眼子」粘土人

机器之心 ·

本文介绍了一种新型神经头像技术，能够以百万像素分辨率生成高质量头像，适用于实时应用。该技术结合中等分辨率视频和高分辨率图像，显著提升了推理速度和视觉质量。研究还提出了通过单视角图像重建和动画化三维头像的方法，展示了在动画和重建方面的优越性。新模型EMOPortraits增强了对强烈面部表情的支持，并实现了音频驱动的面部动画。

MobilePortrait: 移动设备上实时单拍神经头像

BriefGPT - AI 论文速递 ·

本文介绍了一种基于预训练StyleGAN的框架，能够生成高分辨率视频，实现音频驱动的面部动画和灵活的面部编辑。该方法通过视频和音频生成模块优化合成效果，表现优于现有技术，生成自然的对话人脸视频，并在面部表情和头部姿态控制方面具有较高的质量和灵活性。

通过 StyleGAN 实现基于音频的高分辨率无缝对口视频编辑

BriefGPT - AI 论文速递 ·

本文介绍了基于扩散模型的人脸交换技术，提出了BlendFace身份编码器以解决身份与属性的纠缠问题，并展示了其在换脸模型中的有效性。同时，探讨了面部动画框架和高可编辑性的人脸个性化方法，强调了控制性和可扩展性的优势。

用于 Fine-Grained ID 和属性控制的预训练扩展模型的脸部适配器

BriefGPT - AI 论文速递 ·

研究者开发了EMOTE系统，实现面部三维动画的情感表达与语音同步。该系统通过口型识别训练表情，并结合语音特征生成自然的面部动画，利用深度学习技术提高动画的生动性和准确性，最终实现高质量的交谈头视频生成。

CSTalk: 协作监督的语音驱动 3D 情感面部动画生成

BriefGPT - AI 论文速递 ·

本文介绍了一种基于声音分解学习的方法，旨在提升音频驱动的视频生成性能，生成更逼真的面部动画。研究提出了情感视频肖像系统和可控面部动作的谈话面孔生成框架，实现高保真度的面部表情和唇部同步，且在多项指标上超越现有技术。

EDTalk: 高效情感演讲头部合成

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，通过引入锚定帧概念，增强面部动画生成的身份保真度和编辑能力。利用3D参数化模型，改进了面部动作和表情的捕捉，提升了生成视频的质量和一致性。同时，研究探讨了基于文本的3D头部生成和人体运动生成模型，展示了在多视角一致性和运动预测方面的优势。

基于扩散的二维角色生成框架：Make-Your-Anchor

BriefGPT - AI 论文速递 ·

研究者开发了 EMOTE 系统，实现了面部三维动画的情感表达与语音同步。通过分析音频与面部动作的关系，提出了 EMO 框架，生成高表现力的动画。此外，SadTalker 和 VividTalk 等方法提升了说话头像视频的真实感和质量，展示了情感传达和面部表情生成的进展。

EmoVOCA: 语音驱动的情感三维交谈头像

BriefGPT - AI 论文速递 ·

AvatarPoser 是一种高准确性和实时性的全身姿势预测方法，支持虚拟人物控制。EgoPoser 通过头戴设备跟踪手部位置，能够准确建模身体姿势，推断速度超过每秒600帧。此外，研究还提出了适用于 VR 的面部动画实时管道和基于图像的 FaceVR 方法，实现高质量的虚拟会议效果。

头戴式传感器实时模拟化身

BriefGPT - AI 论文速递 ·

Myportrait是一种生成逼真说话脸部的神经画廊生成框架，通过加入个性化先验和三维人脸形变空间的可变先验，在单目视频中生成个性化细节。该框架支持基于视频和基于音频的面部动画，并提供实时在线版本和高质量离线版本。实验证明该方法在各个指标上优于最先进方法。

朝着更好的无鬼影伪装脸部图像

BriefGPT - AI 论文速递 ·

本文提出了一种新的方法，将基于语音的面部动画转化为代码查询任务，减少了不确定性，提高了生成的运动的生动性。通过使用自动回归模型，演示了该方法在视觉和感知质量上的优势。

PMMTalk：基于互补伪多模特征的语音驱动 3D 面部动画

BriefGPT - AI 论文速递 ·

《最终幻想7：核心危机 - 重聚》使用虚幻引擎以现代化方式重塑PSP经典

Unreal Engine ·