NavAgent:用于无人机实体视觉与语言导航的多尺度城市街景融合
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出NavAgent模型,旨在解决户外城市场景中的视觉与语言导航挑战,通过图卷积网络整合多尺度环境信息,提升无人机导航能力。
🎯
关键要点
-
本研究提出NavAgent模型,旨在解决户外城市场景中的视觉与语言导航挑战。
-
NavAgent模型整合了多尺度环境信息,以实现更好的导航任务。
-
该模型通过动态增长的场景拓扑图与图卷积网络编码全局环境数据。
-
NavAgent显著提高了无人机在复杂城市环境中的导航能力。
➡️