VLFM: 视觉语言前沿地图用于零样本语义导航
原文中文,约700字,阅读约需2分钟。发表于: 。人类如何利用语义知识在陌生环境中导航并决定下一步探索的方式对于开发能够展现类似人类搜索行为的机器人来说至关重要。我们介绍了一种零样本导航方法,即视觉语言前沿地图(VLFM),其受人类推理的启发,并设计用于在新环境中驶向未见过语义对象。VLFM 根据深度观测建立占用地图,以识别前沿,并利用 RGB 观测和预训练的视觉语言模型生成基于语言的价值地图。然后,VLFM...
本文介绍了视觉语言前沿地图(VLFM)的零样本导航方法,通过深度观测建立占用地图,并利用视觉语言模型生成基于语言的价值地图,以识别探索最有希望的前沿。VLFM 在对象目标导航任务中取得了最先进的结果,且具有零样本特性,可轻松部署在现实世界的机器人上。关键词:零样本导航、视觉语言前沿地图、深度观测、语言模型、目标导航