小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
智源大会 | 天工AI重新定义世界模型,公布Matrix-Game 3.5 最新技术突破

第8届智源大会在北京举行,聚焦世界模型等前沿议题。昆仑万维的刘扬介绍了Matrix-Game的最新进展,提出了一种状态与动作联合生成的新框架。Matrix-Game 3.5计划于2026年发布,旨在突破长时序生成中的记忆瓶颈,推动世界模型在机器人控制与物理交互中的应用。

智源大会 | 天工AI重新定义世界模型,公布Matrix-Game 3.5 最新技术突破

量子位
量子位 · 2026-06-15T03:24:30Z
2026智源大会开幕:推动AI、物理世界和生命科学“三体互动”

2026年北京智源大会聚焦AI前沿技术,汇聚全球顶尖专家与青年科学家,探讨智能体与世界模型的发展。智源研究院发布悟界系列大模型,推动AI从数字世界向物理世界转型。大会强调AI安全与可信性,展示具身智能与药物发现等应用,展望未来AI技术的演进与挑战。

2026智源大会开幕:推动AI、物理世界和生命科学“三体互动”

量子位
量子位 · 2026-06-13T05:19:13Z

迅策科技与博泰车联、赛目科技签署战略合作协议,联合研发基于Token的物理AI与世界模型,推动智能网联汽车应用。三方将构建完整产业体系,聚焦车载语音助手和出行规划,建立Token化AI Agent应用及价值计量体系,共享知识产权与商业收益。

迅策科技与博泰车联、赛目科技联合研发物理AI与世界模型

全球TMT-美通国际
全球TMT-美通国际 · 2026-06-08T07:39:26Z
语言模型动摇认知根基:世界模型一开始就命名错了

大语言模型的成功挑战了传统世界模型理论,认为智能系统通过学习数据中的规律性表现智能,而非重建现实世界。这一观点改变了对知识的理解,强调知识是一种生成能力而非静态存储。同时,人类对外部世界的信念可能受到语言结构的影响,语言塑造了我们对现实的理解。

语言模型动摇认知根基:世界模型一开始就命名错了

极道
极道 · 2026-06-06T00:08:00Z
李飞飞最新长文揭开世界模型真相:空间智能是下一站

李飞飞的文章探讨了“世界模型”的概念,指出其定义混乱,行业需重新梳理。文章将世界模型分为渲染器、模拟器和规划器三类,强调模拟器在连接视觉与行动中的重要性。三者的融合将推动空间智能的发展,使机器不仅能理解世界,还能参与其中。

李飞飞最新长文揭开世界模型真相:空间智能是下一站

极道
极道 · 2026-06-05T23:45:00Z
CVPR 2026,英伟达特斯拉Waymo一块听中国公司讲物理AI

小鹏在CVPR 2026展示了其物理AI技术,首次完整展示世界模型技术图谱。该模型具备主动思考、可控生成和长时序推演能力,结合第二代VLA,提升了自动驾驶的安全性与可控性。小鹏通过密集预测和数据驱动,在自动驾驶领域取得显著进展,成为全球物理AI的领先者。

CVPR 2026,英伟达特斯拉Waymo一块听中国公司讲物理AI

量子位
量子位 · 2026-06-04T11:56:35Z
一个GPT Plus会员的钱,够机器人跑一个月世界模型了

智在无界推出的Being-H-Flash隐式世界模型,月算力成本仅150元,能够在百TOPS级芯片上实现实时运行。该模型通过潜空间推理,降低了计算开销,提升了机器人在动态环境中的预测能力,推动了机器人在生产线上的高效运作和商业化进程。

一个GPT Plus会员的钱,够机器人跑一个月世界模型了

量子位
量子位 · 2026-06-04T03:10:23Z
戴盟机器人完成亿元融资,阿里通义多模态大牛加盟攻关物理世界模型

戴盟机器人完成亿元A轮融资,专注于具身智能中的触觉技术。新任首席AI科学家原玮浩表示,触觉是理解物理世界的关键,团队将重点发展物理世界模型。戴盟通过外发数据采集网络,解决触觉数据采集和多模态对齐问题,推动行业标准化。

戴盟机器人完成亿元融资,阿里通义多模态大牛加盟攻关物理世界模型

量子位
量子位 · 2026-06-04T03:06:59Z
刚刚,李飞飞亲自下场定义世界模型

李飞飞探讨了“世界模型”的定义与功能,强调其在人工智能中的重要性。她将世界模型分为渲染、模拟和规划三大功能,指出模拟器是连接渲染与规划的关键。渲染器关注视觉效果,规划器决定行动。三者的融合将推动机器智能与物理世界的关系发展,未来的挑战在于数据获取与精度的平衡。

刚刚,李飞飞亲自下场定义世界模型

量子位
量子位 · 2026-06-04T00:44:04Z
从看懂世界到做对动作,卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层

卧安机器人发布了OneModel 1.7 FrontoStria-RL,该模型通过隐式传导机制将世界模型与动作执行连接,提升了家庭机器人在真实环境中的操作能力。其在标准评测中的成功率达到99%,显示出在家庭场景中的应用潜力。OneModel通过真实数据的持续反馈不断进化,推动家庭机器人向可靠工作迈进。

从看懂世界到做对动作,卧安机器人OneModel 1.7用一条「隐式通路」打通了具身智能的关键断层

量子位
量子位 · 2026-06-03T12:28:44Z
世界模型榜首易主!跨维智能登顶WorldArena

跨维智能在全球权威评测榜单WorldArena中获得第一名,超越英伟达和谷歌。其模型DSCFuncWorld在Track 2赛道表现优异,展现了强大的数据生成和策略评估能力,证明了其在具身智能领域的技术实力。跨维智能致力于推动具身智能的实际应用。

世界模型榜首易主!跨维智能登顶WorldArena

量子位
量子位 · 2026-06-03T09:54:18Z
近2亿美元!VAST完成新一轮融资,正式披露世界模型路线

通用人工智能公司VAST完成近2亿美元融资,并推出世界模型项目“Project Eden”。该项目旨在通过解耦底层状态推演与视觉呈现,构建可交互的虚拟世界,支持多人实时交互,推动AI在三维空间的理解与应用。

近2亿美元!VAST完成新一轮融资,正式披露世界模型路线

量子位
量子位 · 2026-06-01T09:46:32Z
世界模型赛道,VAST 选了一条还没有人走过的路

世界模型成为AI行业的新焦点,李飞飞和杨立昆获得10亿美元融资。VAST推出Project Eden,采用独立维护状态与渲染架构,支持多人交互和动态更新。VAST强调持续存在的底层状态,推动世界模型向可交互、真实的虚拟环境发展,未来将降低内容创作门槛,成为互动娱乐和科研的基础设施。

世界模型赛道,VAST 选了一条还没有人走过的路

爱范儿
爱范儿 · 2026-06-01T09:05:59Z
τ0-WM——智元的视频-动作世界模型:组合“遥操、umi、人类第一人称视角”数据,未来视觉Latent助力动作生成,然后重新加噪去噪,若自洽取表现最好者直接执行,否则模拟推演找出最佳视觉指引重新生成

研究者提出了一种名为τ0-World Model(τ0-WM)的统一视频-动作世界模型,旨在提升机器人操作的预测能力。该模型结合视频预测、动作生成和任务评估,利用27,300小时的多样化数据进行训练。τ0-WM通过共享的预测网络,提供视频动作模型和动作条件视频模拟器两个接口,优化机器人在执行前的决策过程。

τ0-WM——智元的视频-动作世界模型:组合“遥操、umi、人类第一人称视角”数据,未来视觉Latent助力动作生成,然后重新加噪去噪,若自洽取表现最好者直接执行,否则模拟推演找出最佳视觉指引重新生成

结构之法 算法之道
结构之法 算法之道 · 2026-06-01T04:30:18Z
τ0-WM:最大规模预训练的开源具身世界模型来了

上海创智学院的罗剑岚团队发布了全球最大规模的开源预训练具身世界模型τ0-WM,使用了17800小时的真机遥操作数据。该模型通过评估多个候选动作,提升了机器人在复杂任务中的成功率,推动了预训练与后训练的结合。

τ0-WM:最大规模预训练的开源具身世界模型来了

量子位
量子位 · 2026-05-31T07:38:43Z
英伟达清华团队提出Gamma-World:世界模型从「一个人玩」到「多人共处」

Gamma-World是NVIDIA与多所高校合作开发的多智能体世界建模框架,旨在解决现有模型在多玩家场景中的局限性。通过单纯形编码和稀疏枢纽注意力的引入,Gamma-World实现了高效的身份表示和交互建模,支持实时生成和零样本泛化,显著提升了多智能体协作的仿真能力,适用于现实世界的多主体协作场景。

英伟达清华团队提出Gamma-World:世界模型从「一个人玩」到「多人共处」

量子位
量子位 · 2026-05-30T06:33:58Z
英伟达清华团队提出Gamma-World:世界模型从「一个人玩」到「多人共处」

Gamma-World是NVIDIA与多所高校合作开发的多智能体世界建模框架,旨在解决现有模型在多玩家场景中的局限性。通过单纯形编码和稀疏枢纽注意力的引入,Gamma-World实现了高效的身份表示和跨智能体通信,显著提升了生成质量和实时性。该模型在多种任务中表现优异,展示了在真实物理场景中的广泛应用潜力。

英伟达清华团队提出Gamma-World:世界模型从「一个人玩」到「多人共处」

量子位
量子位 · 2026-05-30T03:17:17Z
刚刚,全球⾸个“事件级预测”具身智能世界模型来了!

自变量机器人团队发布了全球首个事件级预测模型WALL-WM,旨在提升机器人理解和执行动作的能力。该模型通过将预测单位从时间帧转为语义事件,使机器人更灵活地应对物理世界的变化。WALL-WM结合视觉、语言和动作信息,增强了机器人在复杂任务中的泛化能力。

刚刚,全球⾸个“事件级预测”具身智能世界模型来了!

量子位
量子位 · 2026-05-29T07:02:05Z
世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”

极佳视界推出了具身智能机器人拾光S1,计划在家庭场景中部署100台。该机器人采用轮臂设计,专注于家庭日常任务。公司展示了“双金字塔”技术体系,解决了数据和算法瓶颈,预计在12个月内实现物理AGI突破。团队背景强大,融资成功,未来将关注家庭数据闭环和模型迭代进展。

世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”

量子位
量子位 · 2026-05-28T13:01:16Z
“VLA和世界模型都不是终局,会有物理世界独有的模型” | 蚂蚁灵波沈宇军@AIGC2026

蚂蚁灵波科技首席科学家沈宇军在2026中国AIGC产业峰会上指出,AI 2.0将从数字世界转向物理世界,强调数据的重要性。他认为机器人行业面临数据短缺,未来需结合VLA和世界模型,推动具身智能的发展。灵波致力于成为机器人时代的“安卓系统”,通过标准化数据和智能化操作提升机器人应用。预计到2028年,具身智能将快速发展。

“VLA和世界模型都不是终局,会有物理世界独有的模型” | 蚂蚁灵波沈宇军@AIGC2026

量子位
量子位 · 2026-05-25T06:56:42Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码