NavAgent:用于无人机实体视觉与语言导航的多尺度城市街景融合

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出NavAgent模型,旨在解决户外城市场景中的视觉与语言导航挑战,通过图卷积网络整合多尺度环境信息,提升无人机导航能力。

🎯

关键要点

  • 本研究提出NavAgent模型,旨在解决户外城市场景中的视觉与语言导航挑战。

  • NavAgent模型整合了多尺度环境信息,以实现更好的导航任务。

  • 该模型通过动态增长的场景拓扑图与图卷积网络编码全局环境数据。

  • NavAgent显著提高了无人机在复杂城市环境中的导航能力。

➡️

继续阅读