量子位 ·

首款推理具身模型，谷歌DeepMind造！自主理解/规划/执行复杂任务，打破一机一训，还能互相0样本迁移技能

💡 原文中文，约4400字，阅读约需11分钟。

📝

内容提要

谷歌DeepMind推出了Gemini Robotics 1.5系列具身推理模型，具备自主理解、规划和执行复杂任务的能力，结合视觉、语言与动作，支持多步任务和跨平台技能迁移，提升机器人在现实世界中的应用潜力。

🎯

🔎

Gemini Robotics 1.5系列的推出标志着机器人技术的一次重大进步。通过具身推理，机器人不仅能执行简单任务，还能理解复杂情境并进行多步操作。这种能力使得机器人在实际应用中更具灵活性和智能，能够适应不同的环境和需求。

GR 1.5系列的Motion Transfer机制实现了机器人技能的零样本迁移，意味着一个机器人上学到的技能可以直接应用到其他机器人上。这一创新大大降低了机器人部署的复杂性，提升了多种机器人协同工作的效率，具有广泛的应用前景。

GR 1.5系列在安全性方面表现出色，具备风险识别与干预能力。这种安全性与机器人推理能力的结合，不仅增强了机器人在复杂环境中的可靠性，也提升了人类对其操作过程的理解和信任，推动了人机协作的进一步发展。

❓

Gemini Robotics 1.5系列具备自主理解、规划和执行复杂任务的能力，支持多步任务和跨平台技能迁移。

GR 1.5负责动作执行，而GR-ER 1.5强化推理能力，提供规划与理解支持。

Motion Transfer机制实现了跨平台的技能迁移，使得不同机器人之间的动作经验可以共享和复用。

GR 1.5系列具备风险识别与干预能力，能够理解动作背后的物理风险，确保安全性。

开发者可以通过Google AI Studio中的Gemini API使用GR-ER 1.5模型。

在230项任务的基准测试中，GR 1.5在多个维度上表现优异，明显优于前代模型。

🏷️