首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能

💡 原文中文,约4400字,阅读约需11分钟。
📝

内容提要

谷歌DeepMind推出了Gemini Robotics 1.5系列具身推理模型,具备自主理解、规划和执行复杂任务的能力,结合视觉、语言与动作,支持多步任务和跨平台技能迁移,提升机器人在现实世界中的应用潜力。

🎯

关键要点

  • 谷歌DeepMind推出Gemini Robotics 1.5系列具身推理模型,具备自主理解、规划和执行复杂任务的能力。
  • Gemini Robotics 1.5系列包含两个模型:GR 1.5负责动作执行,GR-ER 1.5强化推理能力。
  • GR 1.5能够执行多步任务,如分类衣物和根据天气打包行李。
  • 模型支持在不同机器人之间进行零样本跨平台技能迁移。
  • GR-ER 1.5具备模拟推理能力,能将复杂任务拆解为小步骤并逐一执行。
  • GR 1.5系列能够适配多种机器人硬件,简化了部署过程。
  • 提出了全新的Motion Transfer机制,实现了跨平台的技能迁移。
  • GR 1.5系列在安全性方面表现出色,具备风险识别与干预能力。
  • 在基准测试中,GR 1.5在多个维度上超越了前代模型,展现出强大的性能。
  • 开发者可以通过Google AI Studio中的Gemini API使用GR-ER 1.5,GR 1.5目前仅供少数合作伙伴使用。
➡️

继续阅读