小红花·文摘

谷歌在机器人领域取得重大进展，推出了RT-2模型，具备符号理解、推理和人类识别能力。AutoRT、SARA-RT和RT-Trajectory等研究成果能够提高机器人的决策速度、环境理解和任务完成能力。

结构之法算法之道 ·

通过在互联网数据上训练视觉语言模型，将其融入机器人控制，提高泛化能力和语义推理。RT-2在训练中获得新能力，包括对新对象的泛化、解释不在训练数据中的命令和初步推理用户指令。RT-2还可进行多阶段的语义推理。

BriefGPT - AI 论文速递 ·