审慎行事:揭示 GPT-4V 在机器人视觉语言规划中的能量 我们介绍了一种名为 Robotic Vision-Language Planning (ViLa) 的新方法,该方法结合了视觉 - 语言模型和长期规划,通过直接整合感知数据来生成可行步骤序列,以在广泛的开放世界操纵任务中展示其优势。 本研究介绍了RoboGPT,一种机器人代理,通过两个模块实现日常任务决策。使用新的机器人数据集和RoboGPT增强规划,成功超越了当前最先进的方法。 RoboGPT gpt 增强规划 日常任务决策 机器人 机器人代理 机器人数据集