有限视野跨视角地理定位的窗口到窗口 BEV 表示学习
原文中文,约600字,阅读约需2分钟。发表于: 。通过在地面查询图像中直接学习 BEV 表示,本研究首次探索了跨视图地理定位中由于视角变化导致的巨大挑战。为了解决由于未知方向性和相机参数缺失所造成的 BEV 查询与地面参考之间的不确定性,我们提出了一种新颖的窗口到窗口 BEV 表示学习方法,称为 W2W-BEV。该方法通过将预定义的 BEV 嵌入和提取的地面特征分割成固定数量的窗口,并基于上下文感知的窗口匹配策略,为每个 BEV...
本研究通过直接学习地面查询图像中的BEV表示,解决了跨视图地理定位中的挑战。提出了一种新的W2W-BEV方法,通过窗口匹配和交叉注意力学习稳健的BEV表示。实验结果表明,在未知方向和有限视野的条件下,W2W-BEV方法相较于先前的方法具有显著优势。