2026年北京智源大会聚焦AI前沿技术,汇聚全球顶尖专家与青年科学家,探讨智能体与世界模型的发展。智源研究院发布悟界系列大模型,推动AI从数字世界向物理世界转型。大会强调AI安全与可信性,展示具身智能与药物发现等应用,展望未来AI技术的演进与挑战。
迅策科技与博泰车联、赛目科技签署战略合作协议,联合研发基于Token的物理AI与世界模型,推动智能网联汽车应用。三方将构建完整产业体系,聚焦车载语音助手和出行规划,建立Token化AI Agent应用及价值计量体系,共享知识产权与商业收益。
大语言模型的成功挑战了传统世界模型理论,认为智能系统通过学习数据中的规律性表现智能,而非重建现实世界。这一观点改变了对知识的理解,强调知识是一种生成能力而非静态存储。同时,人类对外部世界的信念可能受到语言结构的影响,语言塑造了我们对现实的理解。
李飞飞的文章探讨了“世界模型”的概念,指出其定义混乱,行业需重新梳理。文章将世界模型分为渲染器、模拟器和规划器三类,强调模拟器在连接视觉与行动中的重要性。三者的融合将推动空间智能的发展,使机器不仅能理解世界,还能参与其中。
小鹏在CVPR 2026展示了其物理AI技术,首次完整展示世界模型技术图谱。该模型具备主动思考、可控生成和长时序推演能力,结合第二代VLA,提升了自动驾驶的安全性与可控性。小鹏通过密集预测和数据驱动,在自动驾驶领域取得显著进展,成为全球物理AI的领先者。
智在无界推出的Being-H-Flash隐式世界模型,月算力成本仅150元,能够在百TOPS级芯片上实现实时运行。该模型通过潜空间推理,降低了计算开销,提升了机器人在动态环境中的预测能力,推动了机器人在生产线上的高效运作和商业化进程。
戴盟机器人完成亿元A轮融资,专注于具身智能中的触觉技术。新任首席AI科学家原玮浩表示,触觉是理解物理世界的关键,团队将重点发展物理世界模型。戴盟通过外发数据采集网络,解决触觉数据采集和多模态对齐问题,推动行业标准化。
李飞飞探讨了“世界模型”的定义与功能,强调其在人工智能中的重要性。她将世界模型分为渲染、模拟和规划三大功能,指出模拟器是连接渲染与规划的关键。渲染器关注视觉效果,规划器决定行动。三者的融合将推动机器智能与物理世界的关系发展,未来的挑战在于数据获取与精度的平衡。
卧安机器人发布了OneModel 1.7 FrontoStria-RL,该模型通过隐式传导机制将世界模型与动作执行连接,提升了家庭机器人在真实环境中的操作能力。其在标准评测中的成功率达到99%,显示出在家庭场景中的应用潜力。OneModel通过真实数据的持续反馈不断进化,推动家庭机器人向可靠工作迈进。
跨维智能在全球权威评测榜单WorldArena中获得第一名,超越英伟达和谷歌。其模型DSCFuncWorld在Track 2赛道表现优异,展现了强大的数据生成和策略评估能力,证明了其在具身智能领域的技术实力。跨维智能致力于推动具身智能的实际应用。
通用人工智能公司VAST完成近2亿美元融资,并推出世界模型项目“Project Eden”。该项目旨在通过解耦底层状态推演与视觉呈现,构建可交互的虚拟世界,支持多人实时交互,推动AI在三维空间的理解与应用。
世界模型成为AI行业的新焦点,李飞飞和杨立昆获得10亿美元融资。VAST推出Project Eden,采用独立维护状态与渲染架构,支持多人交互和动态更新。VAST强调持续存在的底层状态,推动世界模型向可交互、真实的虚拟环境发展,未来将降低内容创作门槛,成为互动娱乐和科研的基础设施。
研究者提出了一种名为τ0-World Model(τ0-WM)的统一视频-动作世界模型,旨在提升机器人操作的预测能力。该模型结合视频预测、动作生成和任务评估,利用27,300小时的多样化数据进行训练。τ0-WM通过共享的预测网络,提供视频动作模型和动作条件视频模拟器两个接口,优化机器人在执行前的决策过程。
上海创智学院的罗剑岚团队发布了全球最大规模的开源预训练具身世界模型τ0-WM,使用了17800小时的真机遥操作数据。该模型通过评估多个候选动作,提升了机器人在复杂任务中的成功率,推动了预训练与后训练的结合。
Gamma-World是NVIDIA与多所高校合作开发的多智能体世界建模框架,旨在解决现有模型在多玩家场景中的局限性。通过单纯形编码和稀疏枢纽注意力的引入,Gamma-World实现了高效的身份表示和交互建模,支持实时生成和零样本泛化,显著提升了多智能体协作的仿真能力,适用于现实世界的多主体协作场景。
Gamma-World是NVIDIA与多所高校合作开发的多智能体世界建模框架,旨在解决现有模型在多玩家场景中的局限性。通过单纯形编码和稀疏枢纽注意力的引入,Gamma-World实现了高效的身份表示和跨智能体通信,显著提升了生成质量和实时性。该模型在多种任务中表现优异,展示了在真实物理场景中的广泛应用潜力。
自变量机器人团队发布了全球首个事件级预测模型WALL-WM,旨在提升机器人理解和执行动作的能力。该模型通过将预测单位从时间帧转为语义事件,使机器人更灵活地应对物理世界的变化。WALL-WM结合视觉、语言和动作信息,增强了机器人在复杂任务中的泛化能力。
极佳视界推出了具身智能机器人拾光S1,计划在家庭场景中部署100台。该机器人采用轮臂设计,专注于家庭日常任务。公司展示了“双金字塔”技术体系,解决了数据和算法瓶颈,预计在12个月内实现物理AGI突破。团队背景强大,融资成功,未来将关注家庭数据闭环和模型迭代进展。
蚂蚁灵波科技首席科学家沈宇军在2026中国AIGC产业峰会上指出,AI 2.0将从数字世界转向物理世界,强调数据的重要性。他认为机器人行业面临数据短缺,未来需结合VLA和世界模型,推动具身智能的发展。灵波致力于成为机器人时代的“安卓系统”,通过标准化数据和智能化操作提升机器人应用。预计到2028年,具身智能将快速发展。
具脑磐石公司致力于开发认知世界模型,以提升机器人的类脑智能。该模型通过理解物理世界、预测行动后果和持续学习,增强机器人的认知能力。公司已完成亿元融资,计划推进技术研发和市场拓展,目标是实现机器人在真实场景中的应用。
完成下面两步后,将自动完成登录并继续当前操作。