小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Nvidia 让任何人都可以使用其 AI 声音动画技术

Nvidia 开源了 AI 工具 Audio2Face,该工具根据音频输入生成 3D 头像的面部动画。开发者可以利用该工具创建逼真的 3D 角色,适用于游戏和应用程序。Audio2Face 通过分析声音的声学特征生成动画数据,映射到头像的面部表情和唇部动作,并提供训练框架以便用户调整模型。

Nvidia 让任何人都可以使用其 AI 声音动画技术

The Verge
The Verge · 2025-09-25T21:16:23Z

本研究综合评估了生成性人工智能在角色动画中的应用,分析了面部动画、表情渲染和图像合成等技术,指出了当前面临的挑战,并为未来研究方向提供指导。

Generative AI in Character Animation: A Comprehensive Survey of Techniques, Applications, and Future Directions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-27T00:00:00Z

本研究提出了PC-Talk框架,旨在改善音频驱动的口语面孔生成中的面部动画控制,尤其是在唇音同步和情感表达方面。实验结果表明,该方法在HDTF和MEAD数据集上表现优异。

PC-Talk: Precise Facial Animation Control in Audio-Driven Talking Face Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z
人工智能使静态照片生动化,展现自然面部动画的开创性研究

SkyReels-A1是一种新的视频扩散模型,能够将静态肖像照片转化为自然的面部动画。该模型采用变换器架构和运动控制技术,生成高质量且保留身份特征的动态视频。

人工智能使静态照片生动化,展现自然面部动画的开创性研究

DEV Community
DEV Community · 2025-02-20T07:11:19Z

本文介绍了一种基于3D可变形模型的语音驱动说话人脸合成方法,能够从视频中学习特征,生成自然的说话风格。研究提出了DFRT和Talk3D等新方法,利用少量数据和音频驱动生成高质量面部动画,解决个性化风格捕捉的挑战。实验结果表明,这些方法在生成真实感和表现力方面优于现有技术。

模仿谈话:在几分钟内模仿个性化和富有表现力的三维谈话面孔

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-09T00:00:00Z

本文介绍了一种基于音频信号生成个性化逼真说话动画的系统,提出了IMavatar、3D感知生成对抗网络和Myportrait等新方法。这些方法通过深度学习和3D模型整合,提升了面部动画的质量和一致性,成功解决了高质量动态脸部生成的挑战。

稳定的视频肖像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

本文介绍了一种新颖的音频驱动面部动画生成方法,能够生成高质量的说话视频,确保唇语同步和丰富的面部表情。该方法通过多阶段框架和跨模态注意力技术,在生成质量和计算效率上优于现有技术,适用于实际应用。实验结果表明,其在个性化说话风格和视觉细节保持方面表现出色。

PersonaTalk:在视觉配音中突出你的角色

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

本文介绍了一种基于音频驱动的面部动画生成技术,涵盖姿势控制和情感表达。通过自监督学习和新模型,研究实现了高质量的嘴型同步和面部动态分解,提升了动画的自然性和准确性。EDTalk框架支持独立操作嘴型、姿势和情感,实验结果显示其性能优于现有技术。

PoseTalk:基于文本和音频的姿势控制与动作细化的一次性对话头生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z
这个AI小玩物,让马斯克、川建国秒变「缺心眼子」粘土人

Cooraft是一款iPhone应用程序,可以根据自拍生成带有有趣表情的卡通视频。它提供了三个功能:面部动画、风格表情和风格照片。用户可以选择各种滤镜和模板来创建个性化视频。该应用受到了开源项目LivePortrait的启发。Cooraft生成的视频既逼真又幽默,但生成时间可能不一致。该应用提供五次免费使用,之后用户需要付费继续使用。

这个AI小玩物,让马斯克、川建国秒变「缺心眼子」粘土人

机器之心
机器之心 · 2024-07-26T02:10:14Z

本文介绍了一种新型神经头像技术,能够以百万像素分辨率生成高质量头像,适用于实时应用。该技术结合中等分辨率视频和高分辨率图像,显著提升了推理速度和视觉质量。研究还提出了通过单视角图像重建和动画化三维头像的方法,展示了在动画和重建方面的优越性。新模型EMOPortraits增强了对强烈面部表情的支持,并实现了音频驱动的面部动画。

MobilePortrait: 移动设备上实时单拍神经头像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

本文介绍了一种基于预训练StyleGAN的框架,能够生成高分辨率视频,实现音频驱动的面部动画和灵活的面部编辑。该方法通过视频和音频生成模块优化合成效果,表现优于现有技术,生成自然的对话人脸视频,并在面部表情和头部姿态控制方面具有较高的质量和灵活性。

通过 StyleGAN 实现基于音频的高分辨率无缝对口视频编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

本文介绍了基于扩散模型的人脸交换技术,提出了BlendFace身份编码器以解决身份与属性的纠缠问题,并展示了其在换脸模型中的有效性。同时,探讨了面部动画框架和高可编辑性的人脸个性化方法,强调了控制性和可扩展性的优势。

用于 Fine-Grained ID 和属性控制的预训练扩展模型的脸部适配器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-21T00:00:00Z

研究者开发了EMOTE系统,实现面部三维动画的情感表达与语音同步。该系统通过口型识别训练表情,并结合语音特征生成自然的面部动画,利用深度学习技术提高动画的生动性和准确性,最终实现高质量的交谈头视频生成。

CSTalk: 协作监督的语音驱动 3D 情感面部动画生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

本文介绍了一种基于声音分解学习的方法,旨在提升音频驱动的视频生成性能,生成更逼真的面部动画。研究提出了情感视频肖像系统和可控面部动作的谈话面孔生成框架,实现高保真度的面部表情和唇部同步,且在多项指标上超越现有技术。

EDTalk: 高效情感演讲头部合成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z

本研究提出了一种新方法,通过引入锚定帧概念,增强面部动画生成的身份保真度和编辑能力。利用3D参数化模型,改进了面部动作和表情的捕捉,提升了生成视频的质量和一致性。同时,研究探讨了基于文本的3D头部生成和人体运动生成模型,展示了在多视角一致性和运动预测方面的优势。

基于扩散的二维角色生成框架:Make-Your-Anchor

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-25T00:00:00Z

研究者开发了 EMOTE 系统,实现了面部三维动画的情感表达与语音同步。通过分析音频与面部动作的关系,提出了 EMO 框架,生成高表现力的动画。此外,SadTalker 和 VividTalk 等方法提升了说话头像视频的真实感和质量,展示了情感传达和面部表情生成的进展。

EmoVOCA: 语音驱动的情感三维交谈头像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-19T00:00:00Z

AvatarPoser 是一种高准确性和实时性的全身姿势预测方法,支持虚拟人物控制。EgoPoser 通过头戴设备跟踪手部位置,能够准确建模身体姿势,推断速度超过每秒600帧。此外,研究还提出了适用于 VR 的面部动画实时管道和基于图像的 FaceVR 方法,实现高质量的虚拟会议效果。

头戴式传感器实时模拟化身

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-11T00:00:00Z

Myportrait是一种生成逼真说话脸部的神经画廊生成框架,通过加入个性化先验和三维人脸形变空间的可变先验,在单目视频中生成个性化细节。该框架支持基于视频和基于音频的面部动画,并提供实时在线版本和高质量离线版本。实验证明该方法在各个指标上优于最先进方法。

朝着更好的无鬼影伪装脸部图像

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-13T00:00:00Z

本文提出了一种新的方法,将基于语音的面部动画转化为代码查询任务,减少了不确定性,提高了生成的运动的生动性。通过使用自动回归模型,演示了该方法在视觉和感知质量上的优势。

PMMTalk:基于互补伪多模特征的语音驱动 3D 面部动画

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-05T00:00:00Z
《最终幻想7:核心危机 - 重聚》使用虚幻引擎以现代化方式重塑PSP经典

团队通过比较原版游戏与现代游戏的质量,决定保留原版中受玩家喜爱的部分,并增加了升级功能和便利性,使游戏体验更轻松。他们发现原始版本的美术成果和面部动画仍可使用,使战斗更激烈且贴近《最终幻想VII重制版》的风格。这种转变对《核心危机》意义重大。

《最终幻想7:核心危机 - 重聚》使用虚幻引擎以现代化方式重塑PSP经典

Unreal Engine
Unreal Engine · 2023-06-07T17:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码