谷歌DeepMind宣布推出机器人基础模型Gemini Robotics On-Device

InfoQ ·

谷歌DeepMind宣布推出机器人基础模型Gemini Robotics On-Device

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

谷歌DeepMind推出了Gemini Robotics On-Device，这是一个可在机器人硬件上本地运行的视觉-语言-动作基础模型，具备低延迟推理能力，适合本地应用。该模型是Gemini Robotics系列的最新版本，旨在解决延迟和连接性问题，并通过SDK支持开发者定制。

🎯

关键要点

谷歌DeepMind推出Gemini Robotics On-Device，这是一个可在机器人硬件上本地运行的视觉-语言-动作基础模型。
该模型具备低延迟推理能力，适合本地应用，并可通过少量示例进行微调。
Gemini Robotics On-Device是Gemini Robotics系列的最新版本，旨在解决延迟和连接性问题。
该模型遵循自然语言指令，利用视觉识别和推理环境中的物体。
DeepMind在双臂Aloha机器人上训练了该模型，并在多个其他机器人平台上进行了评估。
Gemini Robotics SDK将加速创新，允许开发者根据特定需求定制模型。
DeepMind还发布了多个基准测试，包括评估机器人安全机制的ASIMOV基准和测量视觉推理能力的ERQA评估数据集。
模型在七个不同任务上表现良好，成功完成任务的平均时间超过60%。
Gemini Robotics On-Device尚未普遍提供，感兴趣的开发者可以注册候补名单。

🏷️

继续阅读

OpenClaw 接入 QQ 机器人：腾讯官方入口，1 分钟扫码即用（详细教程）
腾讯开放了QQ机器人功能，用户可通过扫码快速接入，最多可创建5个机器人。创建过程简单，支持独立聊天和工具调用，QQ机器人有望成为OpenClaw的主要入口。
大疆将支付3万美元给意外黑客入侵7000台Romo机器人吸尘器的男子
大疆已开始修复部分漏洞，但尚不确定是否会支付发现者Sammy Azdoufal的奖励，以及其他漏洞的完全修复时间。
我们的开源AI模型SpeciesNet如何助力野生动物保护
SpeciesNet是一个AI模型，能够自动识别近2500种动物，帮助生物学家和保护者快速分析相机捕捉的数据。自2019年起，该工具在多个国家的项目中应用...
黑马图像模型被Nano Banana技术负责人点赞！15人华人小队，DDIM之父&CVPR最佳论文作者带队
Luma AI推出的Uni-1模型在图像理解与生成方面表现优异，超越谷歌的Nano Banana Pro和GPT Image 1.5。该模型由不到15人的...
免费无限量的 GLM-5、Qwen3.5-398B 模型，AtomGit 限时免费
AtomGit推出限时活动，用户可免费使用GLM-5和Qwen3.5-398B模型。但OpenClaw的上下文限制为16K，可能存在设置错误。注册后可调用...
技术获 NVIDIA、Pi 双重认可！原力灵机 DM0 模型重塑具身智能新范式
原力灵机 DM0 模型通过 MemoryVLA 和 Real-time VLA 技术，获得 NVIDIA 和 Pi 的认可，显著提升了机器人的智能和反应速...

谷歌DeepMind宣布推出机器人基础模型Gemini Robotics On-Device

内容提要

关键要点

标签

继续阅读