爱范儿 ·

断网都没用，机器人终于「摆脱」人类控制！Google 首发离线 AI 大脑，一句话让它干活

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

Google DeepMind推出Gemini Robotics On-Device机器人控制模型，该模型可在本地离线运行，具备视觉识别、语言理解和动作执行能力。通过少量示范学习，模型能快速适应多种任务，推动机器人技术的普及与应用，但安全性和多步骤逻辑规划仍需改进。

🎯

🔎

Gemini Robotics On-Device 模型的离线运行能力使其在网络不稳定或完全断网的环境中依然能够执行任务。这对于医疗、灾难救援等对实时性要求极高的场景尤为重要，能够显著降低延迟带来的风险。

尽管 Gemini 模型具备强大的执行能力，但其安全性仍需加强。开发者需为其加装安全机制，以确保执行任务的合理性。此外，模型在多步骤逻辑规划方面的不足，限制了其在复杂任务中的应用，未来的升级可能会改善这一点。

Gemini Robotics On-Device 的强大适配性使其能够在不同类型的机器人平台上运行，这种“一模多用”的能力将加速机器人技术的普及。开发者只需进行轻量级的迁移学习，便可将模型应用于多种机器人，降低了开发成本。

❓

该模型具备视觉识别、语言理解和动作执行能力，能够理解人类指令并流畅完成任务。

它在本地离线运行，减少了延迟，提高了速度和稳定性，适合医疗、灾难救援等对延迟要求高的场景。

开发者只需提供50至100次人工演示，模型便能迅速学会并独立操作。

该模型具有强大的适配性，可以在不同类型的机器人平台上运行，支持轻量级迁移学习。

模型不能合理判断任务的安全性，因此需要加装安全机制以确保执行任务的合理性。

未来可能通过升级到2.5版本来提升多步骤逻辑规划能力，以应对更复杂的任务。

🏷️