小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
SentiPulse携手人大高瓴:开源交互式3D数字人框架SentiAvatar,领跑行业主流模型

SentiPulse与人大高瓴联合推出开源3D数字人框架SentiAvatar,旨在突破数字人行业的表达与动作瓶颈,实现自然流畅的交互。该框架通过高质量数据集和创新模型,提升数字人的情感表达能力,支持实时生成动作与表情,推动数字人向“理解交流”发展。

SentiPulse携手人大高瓴:开源交互式3D数字人框架SentiAvatar,领跑行业主流模型

量子位
量子位 · 2026-04-08T08:30:38Z

谷歌推出了Project Genie,这是一个实验性原型,允许用户通过文本和图像实时生成和探索互动世界。该项目旨在推动通用人工智能的发展,目前已向美国的Google AI Ultra订阅者开放。

项目精灵:探索无限互动世界的实验

The Keyword
The Keyword · 2026-01-29T17:00:00Z

魔珐科技推出全球首个具身智能3D数字人开放平台“魔珐星云”,实现大模型与实体机器人自然互动,支持实时生成数字人的语音、表情和动作,广泛应用于酒店和政务等场景,推动具身智能发展。

全球首个具身智能开放平台来了!让大模型长出“身体”,像人一样自然表达交互

量子位
量子位 · 2025-10-30T03:18:55Z

百度蒸汽机实现了AI视频的实时流式生成,用户可以边观看边生成视频,并随时修改剧情,打破了传统生成的时长限制。这一技术突破使AI视频创作更加互动高效,标志着从短片段向长篇叙事的转变。

Sora2不够香了!国产AI视频模型已能边看边生成,生成快还互动佳

量子位
量子位 · 2025-10-15T11:15:03Z

本研究探讨量子蓄水池计算在时间序列分析中的应用,特别是实时生成《超级马里奥兄弟》关卡。研究者开发了一个新的Roblox游戏,揭示了实时生成中的特定约束,为未来的游戏设计提供了新思路。

Level Generation Using Quantum Reservoir Computing

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

腾讯推出混元图像2.0,实现边说边画的实时图像生成,响应速度达到毫秒级。用户可通过文字或手绘输入,系统即时生成图像。该模型具备更大参数和高效图像编解码器,提升了生成效果和真实感。

鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了

量子位
量子位 · 2025-05-16T06:13:16Z

AI技术正在扩展《我的世界》,玩家可通过简单操作自由探索和创作。Matrix-Game模型支持实时生成高质量场景,提升交互体验,推动3D AIGC发展。

AI无限生成《我的世界》,玩家动动键盘鼠标自主控制!

量子位
量子位 · 2025-05-13T03:57:39Z

本研究提出了一种基于门控循环单元的变分自编码器,旨在学习机器人操控的潜在配置空间表示。该方法能够实时生成新配置,提升机器人操控的灵活性和适应性。

从人类手部到机器人肢体:一种用于远程操作的运动技能体现研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z
拿下近3亿元融资后,爱诗上线新模型,AI视频生成速度杀入10秒大关

爱诗科技的PixVerse V3.5视频模型实现接近实时的生成速度,显著提升运动控制和画质,支持多种动画风格,降低影视制作门槛,提供流畅的内容创作体验。

拿下近3亿元融资后,爱诗上线新模型,AI视频生成速度杀入10秒大关

机器之心
机器之心 · 2024-12-30T05:08:26Z

本研究提出了一种新方法,通过在训练中向输入嵌入注入随机噪声,解决了连续自回归模型在生成长序列时的误差积累问题。实验表明,该方法在音乐音频生成中显著提升了性能,为实时和交互式生成应用提供了新可能性。

Continuous Autoregressive Models with Noise Augmentation to Avoid Error Accumulation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z
RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽

开源公司Lightricks推出LTX-Video,这是首个实时生成高质量视频的模型。该模型在Nvidia H100上仅需4秒生成5秒的24FPS视频,完全开源,支持低成本本地运行,能够提供自然逼真的效果,减少闪烁和伪影,确保视频细节清晰。未来将发布技术报告。

RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽

机器之心
机器之心 · 2024-11-24T13:50:27Z

本研究提出了一种新系统,使用Open AI的Whisper替代传统音频特征提取模型,解决了实时谈话头像生成中的延迟问题。实验结果表明,Whisper提高了处理速度和渲染质量,增强了AI化身在采访者培训中的应用潜力。

Comparative Analysis of Audio Feature Extraction for Real-Time Conversational Avatar Synthesis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z
全AI生成的游戏,到达引发恐怖谷效应的阶段了

AI公司DecartAI与Etched推出了Oasis世界引擎,能够实时生成类似《我的世界》的游戏画面和规则。尽管每秒生成20帧且画质为360p,玩家体验依然自由多变。然而,游戏画面跳跃使部分玩家感到不适,甚至恐惧,显示出AI游戏的快速发展。

全AI生成的游戏,到达引发恐怖谷效应的阶段了

游戏研究社
游戏研究社 · 2024-11-10T14:30:00Z
每帧都是AI实时生成的,全球首款AI游戏问世了!

AI游戏Oasis实现实时生成,颠覆传统开发,玩家可自由探索个性化世界。该技术基于Transformer架构,具备快速和强互动性,但存在记忆短板。Etched与Decart AI合作,推动AI游戏新形态。

每帧都是AI实时生成的,全球首款AI游戏问世了!

机器之心
机器之心 · 2024-11-02T07:04:25Z

斯坦福吴佳俊团队与MIT合作开发的WonderWorld,能够在10秒内实时生成3D场景,速度比现有方法快近100倍。用户只需上传一张图片,即可交互生成无限扩展的虚拟世界,支持多种场景和视觉风格,显著提升了交互式3D生成的可能性。

10秒创造一个世界!吴佳俊团队新作实时交互式3D世界生成

量子位
量子位 · 2024-10-26T08:51:38Z

新一代生成式AI工具如MusicFX DJ和Music AI Sandbox,旨在简化音乐创作,适合各类用户。通过与音乐行业合作,提供实时生成音乐功能,用户可通过文本提示混合风格,创造独特音景。工具支持高质量音频流和便捷分享,推动音乐创作的未来。

新一代生成式AI工具开启音乐创作的新篇章

Google DeepMind Blog
Google DeepMind Blog · 2024-10-23T16:53:00Z

谷歌DeepMind推出的音乐生成模型Lyria驱动的MusicFX DJ和Music AI Sandbox工具,旨在通过AI支持音乐创作。新版本的MusicFX DJ允许用户实时生成音乐,提供直观控制,鼓励创作和实验,用户可以混合多种音乐风格,实时调整音质和节奏,提升音乐创作的可及性和乐趣。

新的生成性人工智能工具开启音乐创作的大门

Google DeepMind Blog
Google DeepMind Blog · 2024-10-23T16:53:00Z
扩散模型做游戏引擎,单TPU 20 FPS模拟毁灭战士,谷歌最新GameNGen太博眼球了

谷歌研究者开发了GameNGen游戏引擎,可以实时生成《毁灭战士》的游戏画面,每秒20帧,标志着人工智能领域的重要进展。该技术可推广到其他视频游戏,实现高质量交互模拟。

扩散模型做游戏引擎,单TPU 20 FPS模拟毁灭战士,谷歌最新GameNGen太博眼球了

机器之心
机器之心 · 2024-08-29T03:39:46Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码