小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从”对口型”到”数字人” 音频驱动虚拟人合成技术全景解析

自2021年以来,音频驱动虚拟人合成技术迅速发展,结合静态图像与音频生成同步视频,广泛应用于直播和客服等领域。主要技术挑战包括身份保持与音视频同步。近年来,扩散模型成为主流,推动了该领域的进步。关键研究包括Hallo2、Let Them Talk和OmniHuman-1,分别聚焦于长视频生成、多人人物对话及全身数字人模型,展现出显著的技术突破与商业潜力。

从”对口型”到”数字人” 音频驱动虚拟人合成技术全景解析

实时互动网
实时互动网 · 2026-05-25T06:33:54Z
美团 LongCat-Video-Avatar 正式发布,实现开源 SOTA 级拟真表现

美团开源的LongCat-Video-Avatar模型在虚拟人视频生成方面取得显著进展,支持多任务生成,提升了动作拟真度和长视频稳定性,解决了身份一致性问题,广泛应用于影视和教育等领域。

美团 LongCat-Video-Avatar 正式发布,实现开源 SOTA 级拟真表现

美团技术团队
美团技术团队 · 2025-12-23T00:00:00Z
美团 LongCat-Video-Avatar 发布,实现开源SOTA级拟真表现

美团开源的LongCat-Video-Avatar模型在虚拟人视频生成方面取得显著进展,支持多任务生成,提升了动作拟真度和长视频稳定性,解决了身份一致性问题,广泛应用于影视娱乐等领域。

美团 LongCat-Video-Avatar 发布,实现开源SOTA级拟真表现

实时互动网
实时互动网 · 2025-12-18T09:35:30Z
开源 | InfiniteTalk:无限长虚拟人视频生成的新范式

InfiniteTalk是一种新型的稀疏帧视频配音技术,解决了传统配音中口型与情感不一致的问题。该模型通过流式生成架构和软条件控制,实现全身动作与音频的自然同步,提升视频的真实感和连贯性,具有广泛的应用潜力。

开源 | InfiniteTalk:无限长虚拟人视频生成的新范式

美团技术团队
美团技术团队 · 2025-09-21T00:00:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。

不止会动嘴,还会「思考」!字节跳动发布OmniHuman-1.5,让虚拟人拥有逻辑灵魂

机器之心
机器之心 · 2025-09-05T07:22:47Z
a16z: AI 虚拟人发展趋势

AI虚拟人技术正在迅速发展,能够生成真实的面孔、声音和动作,广泛应用于内容创作、广告和企业沟通。尽管目前仍处于初级阶段,但已取得显著进展,未来前景广阔。

a16z: AI 虚拟人发展趋势

宝玉的分享
宝玉的分享 · 2025-04-13T17:25:29Z

本文针对以往生成多样化数字化虚拟人时面临的解耦合组件生成难题,提出了一种新颖的方法LayerAvatar。该方法基于分层UV特征平面表示,能够实现高分辨率实时渲染和可控动画,显著提高了解耦合服装虚拟人的生成效果,以及在组件转移中的应用潜力。

解耦合服装虚拟人生成的分层表示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-08T00:00:00Z

ChatBird是一款AI陪伴应用,用户可与多种虚拟人对话,模拟职场和生活场景,提供建议和解决方案。它结合游戏元素,增强互动体验,帮助用户应对日常挑战,提升社交能力。

一言不合和boss耳光大战,年轻人蜷缩的AI世界好癫

量子位
量子位 · 2025-01-06T05:06:04Z

讯飞推出的《Her》虚拟人具备高度逼真的表情和动作,用户可通过照片和一句话自定义虚拟形象。讯飞星火4.0 Turbo大模型在多模态交互和情感感知方面超越GPT-4,支持多语言,广泛应用于教育和医疗领域,推动AI技术发展。

讯飞版《Her》长脸了!多模态虚拟人表情动作超逼真,一张图一句话就能DIY自己

量子位
量子位 · 2024-10-24T11:17:13Z

在GITEX GLOBAL展会上,Soul展示了其AI社交产品,结合3D虚拟人和多模态互动。用户可以创建3D形象,与AI进行语音、文本和视觉交互。Soul计划在11月推出全双工视频通话功能。展会吸引了众多科技公司,展示AI在社交领域的创新。

国产3D虚拟人版《Her》「杀向」迪拜

量子位
量子位 · 2024-10-20T08:32:39Z

本文介绍了多个新颖的3D头像生成框架,如SwiftAvatar、AlteredAvatar和X-Oscar,利用GAN、NeRF和文本提示等技术,实现高质量、可动画的3D头像生成。这些方法在生成速度、视觉质量和用户定制性方面表现优越,适用于多模态应用,推动了数字化头像的研究与发展。

数字化虚拟人:框架开发及其评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码