本文介绍了新算法LGX,该算法利用大型语言模型(LLMs)提升机器人在未知环境中的导航成功率27%。研究探讨了LLMs在机器人导航中的应用及影响模型输出的语义因素,并通过真实实验验证了LGX在视觉对象检测和导航中的优越性能。
该文介绍了一种新算法LGX,实现机器人导航到未被探索的目标对象。利用语言驱动、零-shot方式,将环境的语义上下文映射为机器人运动规划的连续输入。同时利用预训练的视觉语言接地模型进行目标检测。在RoboTHOR上实现了最新的零-shot目标导航结果,成功率提高了超过27%。通过真实世界实验展示了LGX方法的优越性能。
本文介绍了一种新算法LGX,实现机器人导航到未探索环境中的目标对象。该算法利用大型语言模型将环境的语义上下文映射为机器人运动规划的连续输入,同时利用预训练的视觉语言接地模型进行目标检测。在RoboTHOR上实现了最新的零-shot目标导航结果,成功率比当前基线提高了超过27%。通过真实世界实验展示了LGX方法的优越性能,可有效导航和检测视觉上独特的对象。
完成下面两步后,将自动完成登录并继续当前操作。