本研究提出了一种新方法,通过指令中的隐含子目标的视觉表征,提升视觉与语言导航代理在未知环境中的导航性能,显著提高成功率和成功比例。
本研究提出了一种新方法,利用指令中的隐含子目标的视觉表征。
该方法旨在提升视觉与语言导航代理在未知环境中的导航性能。
研究发现,导航代理的成功率和成功比例显著提高。
这一结果表明视觉理解得到了增强。
完成下面两步后,将自动完成登录并继续当前操作。