有限视野跨视角地理定位的窗口到窗口 BEV 表示学习

通过在地面查询图像中直接学习 BEV 表示，本研究首次探索了跨视图地理定位中由于视角变化导致的巨大挑战。为了解决由于未知方向性和相机参数缺失所造成的 BEV 查询与地面参考之间的不确定性，我们提出了一种新颖的窗口到窗口 BEV 表示学习方法，称为 W2W-BEV。该方法通过将预定义的 BEV 嵌入和提取的地面特征分割成固定数量的窗口，并基于上下文感知的窗口匹配策略，为每个 BEV...

本研究通过直接学习地面查询图像中的BEV表示，解决了跨视图地理定位中的挑战。提出了一种新的W2W-BEV方法，通过窗口匹配和交叉注意力学习稳健的BEV表示。实验结果表明，在未知方向和有限视野的条件下，W2W-BEV方法相较于先前的方法具有显著优势。

BEV表示 W2W-BEV方法交叉注意力地理定位窗口匹配