InfoQ ·

DeepMind发布Gemini Robotics-ER 1.5，用于具身推理

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

谷歌DeepMind推出Gemini Robotics-ER 1.5，这是一个支持空间推理和多步骤规划的机器人推理模型。开发者可以通过Google AI Studio和Gemini API预览该模型，并调整思维预算以平衡响应延迟和推理准确性。Gemini Robotics结合了推理模型与视觉-语言-动作模型，提升了机器人的推理能力，并在15个基准测试中表现优异，适用于多种机器人平台。

🎯

关键要点

谷歌DeepMind推出Gemini Robotics-ER 1.5，这是一个支持空间推理和多步骤规划的机器人推理模型。
开发者可以通过Google AI Studio和Gemini API预览该模型，并调整思维预算以平衡响应延迟和推理准确性。
该模型能够输出基于物体大小、重量和可用性的精确2D点，支持诸如指向可拾取物体的命令。
Gemini Robotics-ER 1.5包含安全机制，防止不安全或物理上不可行的计划，并检查有效载荷限制和工作空间约束。
该模型不直接控制机器人执行器，而是可以调用外部工具，如视觉-语言-动作模型或用户定义的函数来执行命令。
Gemini Robotics结合了推理模型与视觉-语言-动作模型，允许不同配置的机器人共享更高层次的推理能力。
与其他大型机器人模型相比，Gemini Robotics-ER强调可控的推理深度和安全机制。
初步反应显示出兴趣与谨慎，工程师认为可调的推理预算是平衡准确性和部署速度的有用特性。
AI顾问Sonia Sarao认为该模型的通用性将对机器人技术产生变革性影响。
CPA Brian Orlando称其为真正的转折点，认为机器人推理和规划的能力将改变未来。
Gemini Robotics-ER 1.5在15个机器人基准测试中表现出色，兼容多种机器人平台，支持从实验室测试到实际部署的过渡。

🏷️

继续阅读

A New Era of MySQL Community Engagement: Public Community Roadmap Webinar Highlights
Oracle values the MySQL community. MySQL is fundamental to our data strategy....
OpenVidu 3.6.0 发布，支持 DigitalOcean、纯 Docker Compose 部署等功能
OpenVidu 3.6.0 近日发布，新增支持 DigitalOcean、纯 Docker Compose 部署、本地实时字幕和云服务提供商等功能，并改...
天罡智算推出面向产业园区的一人公司专属赋能平台
（全球TMT2026年3月10日讯）近日，天罡智算——上海梵数智算算力科技有限公司旗下AI应用场景一体化解决方 […]
零成本搭建专属AI助手：OpenClaw永久免费部署全攻略
最近 OpenClaw 在开发者圈子里热度飙升，很多人都想拥有一个私有化、可长期运行的AI智能体。但复杂的配置、昂贵的服务器、API费用常常让人望而却步。...
[使用指南] OpenClaw AI机器人现已支持原生备份命令可完整备份所有数据
#人工智能 OpenClaw 最新版已经原生提供备份命令，可以完整备份所有数据并进行备份校验，确保用户重装 / 迁移 / 故障恢复时可以直接使用备份数据。...
实测 5 万元的苹果 AIPC，比我们想象的还要出色｜M5 Max MacBook Pro 评测
在5万元预算内，选择个人电脑时，内存成为关键因素。苹果新发布的M5系列MacBook Pro搭载强大处理器和高带宽统一内存，适合AI应用和游戏，性价比高，...

DeepMind发布Gemini Robotics-ER 1.5，用于具身推理

内容提要

关键要点

标签

继续阅读