Select2Plan:基于视觉问答和记忆检索的无训练内嵌学习规划
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了在自主导航中高层次机器人规划所需的广泛任务特定训练的问题。我们引入了一种名为Select2Plan(S2P)的新型无训练框架,通过结构化视觉问答和内嵌学习,显著减少了对数据收集的需求,并在不需要专门训练的情况下有效利用了通用训练的视觉语言模型。实验表明,该方法在第三人称视角的导航能力提升了约50%,并在第一人称视角下表现出与训练模型相当的效果。
本研究提出了一种名为Select2Plan(S2P)的无训练框架,旨在解决自主导航中机器人规划的任务特定训练问题。该方法通过结构化视觉问答和内嵌学习,显著降低数据需求并提升导航能力。实验结果显示,第三人称视角下能力提升约50%,第一人称视角效果与训练模型相当。