量子位 ·

刚刚，全球⾸个“事件级预测”具身智能世界模型来了！

💡 原文中文，约4700字，阅读约需12分钟。

📝

内容提要

自变量机器人团队发布了全球首个事件级预测模型WALL-WM，旨在提升机器人理解和执行动作的能力。该模型通过将预测单位从时间帧转为语义事件，使机器人更灵活地应对物理世界的变化。WALL-WM结合视觉、语言和动作信息，增强了机器人在复杂任务中的泛化能力。

🎯

🔎

WALL-WM模型通过将预测单位从时间帧转为语义事件，使机器人能够更灵活地应对复杂任务。这种方法不仅提高了机器人的泛化能力，还使其在面对新指令和新场景时，能够更自然地理解和执行动作。

WALL-WM采用多视角时空融合技术，确保机器人在执行任务时能够从不同角度获取信息。这种设计有助于提升模型的准确性和稳定性，避免因视角不对齐而导致的错误判断。

自变量团队通过分布式训练系统和多事件打包，显著降低了训练成本并提高了模型的收敛性。这一创新使得WALL-WM能够在真实场景中展现出强大的泛化能力，适应多种复杂任务。

❓

WALL-WM模型旨在提升机器人理解和执行动作的能力。

WALL-WM将预测单位从时间帧转为语义事件，使机器人更灵活地应对物理世界的变化。

WALL-WM采用三层结构：事件指令入口、事件世界模型和多视角时空融合。

WALL-WM通过事件边界进行训练，使机器人围绕事件理解世界变化，并将这种理解转化为可执行动作。

WALL-WM支持事件模式和统一模式，增强了模型的灵活性和实时控制能力。

WALL-WM通过分布式训练系统和多事件打包，降低了训练成本，提高了收敛和稳定性。

🏷️