量子位 ·

执行复杂任务，打破一机一训，还能互相0样本迁移技能

💡 原文中文，约4400字，阅读约需11分钟。

📝

内容提要

谷歌DeepMind推出了Gemini Robotics 1.5系列具身推理模型，具备自主理解、规划和执行复杂任务的能力，结合视觉、语言与动作，支持多步任务和跨平台技能迁移，提升机器人在现实世界中的应用潜力。

🎯

关键要点

谷歌DeepMind推出Gemini Robotics 1.5系列具身推理模型，具备自主理解、规划和执行复杂任务的能力。
Gemini Robotics 1.5系列包含两个模型：GR 1.5负责动作执行，GR-ER 1.5强化推理能力。
GR 1.5能够执行多步任务，如分类衣物和根据天气打包行李。
模型支持在不同机器人之间进行零样本跨平台技能迁移。
GR-ER 1.5具备模拟推理能力，能将复杂任务拆解为小步骤并逐一执行。
GR 1.5系列能够适配多种机器人硬件，简化了部署过程。
提出了全新的Motion Transfer机制，实现了跨平台的技能迁移。
GR 1.5系列在安全性方面表现出色，具备风险识别与干预能力。
在基准测试中，GR 1.5在多个维度上超越了前代模型，展现出强大的性能。
开发者可以通过Google AI Studio中的Gemini API使用GR-ER 1.5，GR 1.5目前仅供少数合作伙伴使用。

🏷️

继续阅读

Mobileye 2025财年全年营收同比增长15%，达18.94亿美元
Mobileye Global Inc.公布2025财年财报，全年营收18.94亿美元，同比增长15%。第四季度营收下降9%。未来8年汽车订单预期达245...
“给中国供应芯片等于卖核弹”？Anthropic CEO达沃斯激进言论震惊全场，谷歌DeepMind掌门人为何温和反击？｜AGI Demis Hassabis Dario Amodei
在2026年达沃斯论坛上，Anthropic CEO阿姆戴伊将向中国出售芯片比作向朝鲜出售核武器，认为风险极大，并批评中国科技未能赶上美国，强调芯片禁令的...
谷歌不会停止用糟糕的AI替换我们的新闻标题
谷歌在内容推送中使用的AI生成标题常常误导用户，甚至与原文内容相悖。尽管谷歌称这些标题为“趋势话题”，但缺乏准确性和事实核查，影响了新闻传播和作者权益。
具身智能资源汇总：机器人学习数据集，在线体验世界建模模型，英伟达/字节/小米等最新研究论文
本文系统整理了一批具身智能相关的高质量数据集、在线教程、论文，为进一步学习和研究提供参考，欢迎前往 hyper.ai 探索更多优质资源！
微软发布 VibeVoice-ASR：一种统一的语音转文本模型，旨在一次性处理长达 60 分钟的音频
微软推出了VibeVoice-ASR，一个开源的语音转文本模型，支持最长60分钟的音频处理，输出结构化文本，包括“谁”、“何时”、“什么”。该模型允许用户...
谷歌账号Gmail邮箱前缀可以更改了
用户可将Google账号邮箱更改为新地址，旧邮箱将成为备用邮箱，数据不受影响。更改后可随时切换回旧邮箱，但在12个月内无法创建新Gmail账号。重要账号不建议修改。

首款推理具身模型，谷歌DeepMind造！自主理解/规划/执行复杂任务，打破一机一训，还能互相0样本迁移技能

内容提要

关键要点

标签

继续阅读