本研究提出了一种新颖的导航框架,解决了传统视觉语言模型在复杂环境中缺乏几何信息的问题。通过结合动态全球记忆模块与自我观察,提升了空间推理和决策效率,实验结果表明该方法在物体导航任务中表现优异。
完成下面两步后,将自动完成登录并继续当前操作。