小红花·文摘

量子位 ·

量子位 ·

本文解读了Wang和Sun的具身AGI综述，强调AGI的具身性及与物理世界交互的重要性。文章梳理了具身AI的五个发展阶段，从基础LLM到世界模型，展望未来技术突破对社会的影响。

Micropaper ·

自变量机器人CEO王潜认为，具身智能是独立于语言和多模态模型的基础模型，专注于物理世界的复杂性与随机性。现有模型难以准确描述物理现象，因此需要重构基础模型以应对这些挑战。具身智能的发展将改变模型架构和数据处理方式，未来可能超越现有多模态模型。

量子位 ·

李飞飞指出，大语言模型在理解物理世界方面存在局限，因其主要依赖一维语言信号，而物理世界是三维的。尽管模型能处理语言任务，但在空间智能和物理推理上表现不佳，无法真正理解物理现象。这引发了对模型结合物理与多模态理解的讨论。

量子位 ·

Meta发布的V-JEPA 2世界模型能够在62小时内训练机器人，使其理解物理世界并进行预测与规划。该模型通过自监督学习，利用大量视频数据提升机器人控制能力，标志着机器人技术的新纪元。

量子位 ·

文章探讨了语言模型（LLM）与视频模型在学习能力上的差异。尽管视频数据更丰富，LLM却通过简单算法展现出更复杂的认知能力。作者将AI比作“柏拉图洞穴”，指出AI只能模仿人类知识，无法自主探索。未来的目标是让AI能够直接与物理世界互动，突破对人类知识的依赖。

量子位 ·

DEV Community ·

Neuralink的第二位志愿者Alex在一场CS游戏中展示了他使用脑机接口控制光标和设计物体的能力。导线收缩的问题已经解决。Neuralink计划改善用户体验，并开发算法以识别手写意图。最终目标是使脑机接口能够与物理世界互动。

量子位 ·

本文思想实验表明，大型语言模型（LLM）无法像人类一样理解概念。即使使用大量纯中文和英文文本训练同一个LLM，它也无法将英语中的“狗”概念与中文中的“狗”概念联系起来。相比之下，人类可以根据词语与物理世界的关系来处理词语，因此“理解”对于人类和LLM的含义是完全不同的。

极道 ·