小红花·文摘

谷歌推出了Gemini Robotics-ER 1.6，这是一个升级的机器人模型，具备更精准的物理环境理解能力，增强了空间逻辑和多视角理解，提升了自主性，尤其在视觉理解、任务规划和成功检测方面表现优异。此外，该模型能够读取复杂仪表，并且是迄今为止最安全的机器人模型，符合安全政策。开发者可通过Gemini API和Google AI Studio访问该模型。

Gemini Robotics ER-1.6增强推理能力，助力机器人应对现实世界任务

The Keyword ·

论文汇总丨从「理解世界」到「进入世界」，NVIDIA/字节跳动/清华等团队引领的世界模型与VLA技术突破

HyperAI超神经 ·

$RDT2——基于UMI数据实现零样本且跨本体的泛化：先训练VLM、后训练扩散动作专家、最后将扩散策略蒸馏为一步生成器(挑战叠衣服)$

RDT2——基于UMI数据实现零样本且跨本体的泛化：先训练VLM、后训练扩散动作专家、最后将扩散策略蒸馏为一步生成器(挑战叠衣服)

结构之法算法之道 ·

Gemini Robotics On-Device是一个高效的本地机器人模型，具备通用灵活性和快速任务适应能力，能够独立于网络运行，适用于延迟敏感的应用，执行复杂的多步骤指令。开发者可通过SDK进行模型评估和适应，支持快速调整以满足特定需求。该模型在多种测试场景中表现出色，能够完成如折叠衣物等精细任务，推动机器人技术的创新与发展。

Gemini Robotics On-Device将人工智能引入本地机器人设备

Google DeepMind Blog ·

Gemini Robotics On-Device是一个高效的本地机器人模型，具备通用灵活性和快速任务适应能力。该模型独立于网络运行，适用于延迟敏感的应用，能够执行复杂的多步骤指令。开发者可通过SDK轻松评估和调整模型，以满足特定需求。

Gemini Robotics On-Device 将人工智能引入本地机器人设备

Google DeepMind Blog ·