通过语义拓扑度量表示引导的大语言模型推理实现空中视觉与语言导航
发表于: 。本研究针对无人机在户外环境中的视觉与语言导航任务中的空间关系复杂性问题,提出了一种端到端的零样本框架。通过开发一种新的语义拓扑度量表示(STMR),增强了大语言模型(LLM)的空间推理能力,实验证明该方法在Oracle成功率(OSR)上实现了显著提升。
本研究针对无人机在户外环境中的视觉与语言导航任务中的空间关系复杂性问题,提出了一种端到端的零样本框架。通过开发一种新的语义拓扑度量表示(STMR),增强了大语言模型(LLM)的空间推理能力,实验证明该方法在Oracle成功率(OSR)上实现了显著提升。