机器人任务规划的视觉语言解释器
原文中文,约400字,阅读约需1分钟。发表于: 。提出了一种将语言模型和符号规划器相结合的新框架,通过生成语言指令和场景观察的问题描述 (PD) 来驱动符号规划器,实现语言引导的机器人规划,实验结果显示该框架能够以超过 99% 的准确率生成句法正确的问题描述和超过 58% 的准确率生成有效的机器人规划。
该文介绍了一个新的导航框架,用于在真实世界中解决VLN任务。该框架包括四个关键组成部分,能够将语言指令转换为宏操作描述、构建实时的视觉-语言地图、基于语言索引的定位器以及基于DD-PPO的本地控制器。作者在实验室环境中使用Interbotix LoCoBot WX250对该流程进行了评估,并发现该流程优于SOTA VLN基线。