本文提出了一个新型导航框架,用于解决真实世界中的VLN任务。该框架包括语言指令解析器、视觉-语言映射器、定位器和本地控制器等关键组成部分。实验室环境评估显示,该框架在真实世界中表现优于现有的VLN基线。
完成下面两步后,将自动完成登录并继续当前操作。