InfoQ ·

谷歌DeepMind宣布推出机器人基础模型Gemini Robotics On-Device

💡 原文英文，约600词，阅读约需2分钟。

📝

内容提要

谷歌DeepMind推出了Gemini Robotics On-Device，这是一个可在机器人硬件上本地运行的视觉-语言-动作基础模型，具备低延迟推理能力，适合本地应用。该模型是Gemini Robotics系列的最新版本，旨在解决延迟和连接性问题，并通过SDK支持开发者定制。

🎯

🔎

Gemini Robotics On-Device的本地运行特性使其在低延迟和网络不稳定的环境中表现优越。这对于需要实时反应的机器人应用尤为重要，例如自动驾驶和工业自动化，能够显著提高操作效率和安全性。

Gemini Robotics SDK的发布为开发者提供了定制化的机会，允许他们根据特定需求调整模型。这种灵活性将促进机器人技术的创新，开发者可以利用这一工具创建更智能的机器人应用，满足市场多样化的需求。

DeepMind发布的ASIMOV和ERQA基准测试为评估机器人安全性和视觉推理能力提供了标准。这些基准不仅有助于开发者理解模型的性能，还能推动整个行业在安全性和智能化方面的进步。

❓

Gemini Robotics On-Device是一个可在机器人硬件上本地运行的视觉-语言-动作基础模型，具备低延迟推理能力。

该模型可以通过少量示例进行微调，通常只需50个示例即可适应特定任务。

该模型适合需要低延迟或缺乏网络连接的本地应用，如复杂任务的机器人操作。

DeepMind在七个不同任务上测试了该模型，成功完成任务的平均时间超过60%。

Gemini Robotics SDK允许开发者根据特定需求定制模型，促进创新。

感兴趣的开发者可以注册候补名单以获取模型和SDK的访问权限。

🏷️