以基础模型为基础的面向便利性的连续视觉语言导航规划
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
LLM基础代理在视觉语言导航(VLN)任务中展示了零射击性能。通过AO-Planner框架,实现了适应性导航的运动规划和动作决策制定。在R2R-CE基准测试中取得了最先进的零射击性能(SPL提高了5.5%)。
🎯
关键要点
- LLM基础代理在视觉语言导航(VLN)任务中展示了零射击性能。
- 提出了AO-Planner框架,解决实际导航场景中的低级控制问题。
- AO-Planner是一种面向预设语境的连续VLN任务规划框架。
- 通过集成各种基础模型,AO-Planner能够进行适应性导航的运动规划和动作决策。
- 在R2R-CE基准测试中,AO-Planner取得了最先进的零射击性能,SPL提高了5.5%。
- AO-Planner为LLM和三维世界之间的快速有效连接提供了新的前景。
🏷️
标签
➡️