小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文解读了Wang和Sun的具身AGI综述,强调AGI的具身性及与物理世界交互的重要性。文章梳理了具身AI的五个发展阶段,从基础LLM到世界模型,展望未来技术突破对社会的影响。

一分钟读论文:《迈向具身 AGI:具身 AI 综述与未来之路》

Micropaper
Micropaper · 2026-04-09T00:00:00Z

自变量机器人CEO王潜认为,具身智能是独立于语言和多模态模型的基础模型,专注于物理世界的复杂性与随机性。现有模型难以准确描述物理现象,因此需要重构基础模型以应对这些挑战。具身智能的发展将改变模型架构和数据处理方式,未来可能超越现有多模态模型。

自变量王潜:具身智能是物理世界的独立基础模型|MEET2026

量子位
量子位 · 2025-12-21T11:11:12Z

李飞飞指出,大语言模型在理解物理世界方面存在局限,因其主要依赖一维语言信号,而物理世界是三维的。尽管模型能处理语言任务,但在空间智能和物理推理上表现不佳,无法真正理解物理现象。这引发了对模型结合物理与多模态理解的讨论。

李飞飞一年前究竟说了啥?怎么又火了

量子位
量子位 · 2025-09-11T06:32:39Z

Meta发布的V-JEPA 2世界模型能够在62小时内训练机器人,使其理解物理世界并进行预测与规划。该模型通过自监督学习,利用大量视频数据提升机器人控制能力,标志着机器人技术的新纪元。

LeCun世界模型出2代了!62小时搞定机器人训练,开启物理推理新时代

量子位
量子位 · 2025-06-12T08:48:48Z

文章探讨了语言模型(LLM)与视频模型在学习能力上的差异。尽管视频数据更丰富,LLM却通过简单算法展现出更复杂的认知能力。作者将AI比作“柏拉图洞穴”,指出AI只能模仿人类知识,无法自主探索。未来的目标是让AI能够直接与物理世界互动,突破对人类知识的依赖。

不是视频模型“学习”慢,而是LLM走捷径|18万引大牛Sergey Levine

量子位
量子位 · 2025-06-10T09:15:50Z
现实问题与虚拟问题

本文比较了物理世界与数字世界的挑战。矿工兄弟的工作涉及实际机器和资源规划,而软件工程师则专注于虚拟问题和代码修改。尽管复杂性不同,但两者都需要良好的人际沟通和管理能力。物理工作强调严格规划,软件工作则需灵活应变和团队协作。

现实问题与虚拟问题

DEV Community
DEV Community · 2025-01-20T22:49:57Z

本研究探讨了视觉语言模型(VLM)在理解物理世界方面的不足,并提出了改进VLM模型以编码对象状态的三大提升方向。通过构建ChangeIt-Frames数据集并评估多个开源VLM模型,发现这些模型在对象识别方面表现良好,但在区分对象物理状态上存在不足。该研究为未来研究提供了重要依据。

预训练视觉-语言模型是否编码对象状态?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-16T00:00:00Z

Neuralink的第二位志愿者Alex在一场CS游戏中展示了他使用脑机接口控制光标和设计物体的能力。导线收缩的问题已经解决。Neuralink计划改善用户体验,并开发算法以识别手写意图。最终目标是使脑机接口能够与物理世界互动。

脑后插管打CS拼抢三杀!马斯克脑机接口最新进展

量子位
量子位 · 2024-08-22T09:00:13Z

本文思想实验表明,大型语言模型(LLM)无法像人类一样理解概念。即使使用大量纯中文和英文文本训练同一个LLM,它也无法将英语中的“狗”概念与中文中的“狗”概念联系起来。相比之下,人类可以根据词语与物理世界的关系来处理词语,因此“理解”对于人类和LLM的含义是完全不同的。

为何大模型无法像人那样理解概念?

极道
极道 · 2023-10-14T10:50:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码