小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从”对口型”到”数字人” 音频驱动虚拟人合成技术全景解析

自2021年以来,音频驱动虚拟人合成技术迅速发展,结合静态图像与音频生成同步视频,广泛应用于直播和客服等领域。主要技术挑战包括身份保持与音视频同步。近年来,扩散模型成为主流,推动了该领域的进步。关键研究包括Hallo2、Let Them Talk和OmniHuman-1,分别聚焦于长视频生成、多人人物对话及全身数字人模型,展现出显著的技术突破与商业潜力。

从”对口型”到”数字人” 音频驱动虚拟人合成技术全景解析

实时互动网
实时互动网 · 2026-05-25T06:33:54Z
从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

美团开源了LongCat-Video-Avatar 1.5数字人视频模型,提升了唇形同步、稳定性和多人互动能力。通过优化音频特征提取和数据处理,该模型在复杂场景中表现优异,生成效率提高15倍,适用于电商直播和教学等多种场景,推动数字人视频的实际应用。

从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

美团技术团队
美团技术团队 · 2026-05-25T00:00:00Z
从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

美团龙猫LongCat发布了LongCat-Video-Avatar 1.5,提升了数字人视频模型的唇形同步、物理合理性和多人互动能力,支持复杂场景下的高质量内容输出,推理效率提升约15倍。团队希望通过开源推动数字人视频技术的发展。

从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

实时互动网
实时互动网 · 2026-05-22T02:52:42Z
绿盟科技安全数字人平台正式发布:以风云卫为核心,构建自主运营、持续进化的安全数字人团队

绿盟科技推出安全数字人平台,旨在提升安全运营效率。该平台通过数字人团队自主运行,解决传统安全运营中的自动化僵化、数据割裂和经验依赖等问题。用户可通过自然语言与数字人协作,快速完成任务,并支持多种外部系统对接,具备自我进化能力。未来,绿盟科技将继续推动数字人在安全运营中的应用,助力企业实现战略价值提升。

绿盟科技安全数字人平台正式发布:以风云卫为核心,构建自主运营、持续进化的安全数字人团队

绿盟科技技术博客
绿盟科技技术博客 · 2026-05-14T10:02:11Z
直播预告 | 智启安全·数生运营——绿盟科技安全数字人平台重磅发布暨系统演示

绿盟科技推出安全数字人平台,旨在提升安全运营效率,利用AI技术实现从被动响应到主动防御的转变。线上发布会定于5月14日举行,展示平台功能及实战演示。

直播预告 | 智启安全·数生运营——绿盟科技安全数字人平台重磅发布暨系统演示

绿盟科技技术博客
绿盟科技技术博客 · 2026-05-13T08:47:38Z

2026年4月3日,中国出台AI数字人监管新规,禁止未成年人保护和成瘾性设计。数字人直播需实名认证和标注AI合成,内容需合规。合规产品将更稀缺,真人主播价值被重估,成年人市场仍有机会。这一举措为行业划定边界,合规成为竞争优势。

AI监管第一刀砍向数字人:2026年这些玩法已经被定性违法

老杨SEM博客
老杨SEM博客 · 2026-05-07T22:48:03Z
SentiPulse携手人大高瓴:开源交互式3D数字人框架SentiAvatar,领跑行业主流模型

SentiPulse与人大高瓴联合推出开源3D数字人框架SentiAvatar,旨在突破数字人行业的表达与动作瓶颈,实现自然流畅的交互。该框架通过高质量数据集和创新模型,提升数字人的情感表达能力,支持实时生成动作与表情,推动数字人向“理解交流”发展。

SentiPulse携手人大高瓴:开源交互式3D数字人框架SentiAvatar,领跑行业主流模型

量子位
量子位 · 2026-04-08T08:30:38Z
AI口语教学新解:ZEGO AI 数字人破解“开口难”与“成本高”难题

口语学习的难点在于开口说,外教费用高且教学质量不一。AI技术通过实时互动和多模态能力,提供低成本的口语陪练,突破传统教学瓶颈。ZEGO推出AI数字人口语教学方案,满足不同年龄段需求,帮助教育机构降低成本,提高学习效率。

AI口语教学新解:ZEGO AI 数字人破解“开口难”与“成本高”难题

实时互动网
实时互动网 · 2026-03-18T10:05:15Z
AI真人数字人语音对话性能优化实践总结

通过优化AI数字人导购对话性能,端到端延迟从5.64秒降低至1.32秒,提升幅度达76.6%。优化措施包括建立高精度性能监控体系、集成Qwen Omni模型和设计音频窗口缓冲机制,显著改善用户体验和系统稳定性。

AI真人数字人语音对话性能优化实践总结

实时互动网
实时互动网 · 2026-02-26T03:20:09Z
思享无限AI技术迈入大规模商业化应用阶段

思享无限控股有限公司宣布其AI主播已在多款国内外直播产品中投入运营,标志着AI技术的商业化进程。通过真人主播数据训练生成的主播分身,实现24小时直播,提升用户留存率和内容供给。海外平台Beelive也已运营数字人主播,验证了其在不同市场的可复制性。

思享无限AI技术迈入大规模商业化应用阶段

全球TMT-美通国际
全球TMT-美通国际 · 2026-01-29T01:50:07Z
从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂

文章讨论了人工智能的应用与发展,强调其在各领域的潜力和影响,尤其在提升效率和创新方面的重要性。

从「会表演」到「更会演」:KlingAvatar2.0让数字人拥有生动灵魂

机器之心
机器之心 · 2025-12-24T04:08:51Z
数字人动画云端渲染方案

为解决多场景展示中形象的性能问题,本文提出将形象导出为视频或动图,最终选择Puppeteer + H5渲染帧 + FFmpeg合成视频的方案,以确保渲染效果一致、降低接入成本并支持规模化应用。

数字人动画云端渲染方案

实时互动网
实时互动网 · 2025-12-18T06:22:36Z
腾讯混元数字人团队发布Moral RolePlay基准,揭秘大模型的「道德困境」

AI Shortlist 是一项精选内容,展示最新的人工智能技术和应用,汇集行业创新案例和研究成果,帮助用户了解AI的发展趋势和潜在影响。

腾讯混元数字人团队发布Moral RolePlay基准,揭秘大模型的「道德困境」

机器之心
机器之心 · 2025-11-22T11:02:34Z

邦彦技术发布NuwaAI V1.0,用户可通过一句话生成具执行能力的数字人,适用于教育和商业等多个场景,提升生产力,推动数字经济发展。

NuwaAI V1.0发布!一句话生成数字人,全面升级数字生产力

量子位
量子位 · 2025-11-18T11:12:12Z

商汤科技主导制定了我国首个数字人国家标准《信息技术 客服型虚拟数字人通用技术要求》,明确了客服型数字人的形态、功能和性能指标,推动行业规范化发展。商汤的数字人技术已广泛应用于金融和电商等领域,助力企业开发数字人产品。

首个数字人国家标准,商汤牵头定义,正式发布!

量子位
量子位 · 2025-11-18T08:21:52Z
首个数字人国家标准,商汤牵头定义,正式发布!

AI短名单是对长篇文章的简要概述,旨在提炼出核心信息。

首个数字人国家标准,商汤牵头定义,正式发布!

机器之心
机器之心 · 2025-11-18T07:03:00Z
携程数字人直播实战:成本降低90%,我们如何实现规模化落地?

携程数字人直播是一种通过数字人进行商品讲解和用户互动的新模式,已完成数千场直播。该模式结合音色复刻和唇形同步技术,克服了真人直播的局限性,具备高保真音色、实时互动和成本控制等优势。未来将持续完善功能,探索更多应用场景。

携程数字人直播实战:成本降低90%,我们如何实现规模化落地?

实时互动网
实时互动网 · 2025-11-13T09:07:10Z
Kaltura 2700 万美元收购对话式 AI 数字人公司 eSelf.ai

纽约的AI视频平台Kaltura以约2700万美元收购以色列初创公司eSelf.ai,后者专注于对话式虚拟形象。此技术将增强Kaltura视频产品的实时互动能力,提升其市场竞争力。

Kaltura 2700 万美元收购对话式 AI 数字人公司 eSelf.ai

实时互动网
实时互动网 · 2025-11-11T03:23:57Z

百度的高拟真数字人技术使数字人具备说话、演戏、自编剧本和实时互动的能力,提升了直播效果。该技术已在多个行业应用,显著降低成本,提高转化率,成为内容产业的新基础设施。

会写剧本、能凹人设,还顺带站上领奖台,这数字人包“会”的

量子位
量子位 · 2025-11-07T04:20:19Z

全新创作平台SkyReels简化了AI视频制作,用户可在画布上拖拽、对话和编辑,整合多种模型与Agent,提升创作效率。内置模板和数字人功能,支持多角色对话与视频风格化处理,极大便利创作过程。

全新创作平台SkyReels来了!一张画布+对话框包办AI视频创作流程

量子位
量子位 · 2025-11-04T04:46:34Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码