有限视野跨视角地理定位的窗口到窗口 BEV 表示学习
💡
原文中文,约600字,阅读约需2分钟。
📝
内容提要
本研究通过直接学习地面查询图像中的BEV表示,解决了跨视图地理定位中的挑战。提出了一种新的W2W-BEV方法,通过窗口匹配和交叉注意力学习稳健的BEV表示。实验结果表明,在未知方向和有限视野的条件下,W2W-BEV方法相较于先前的方法具有显著优势。
🎯
关键要点
-
本研究通过直接学习地面查询图像中的BEV表示,解决了跨视图地理定位中的挑战。
-
提出了一种新的W2W-BEV方法,通过窗口匹配和交叉注意力学习稳健的BEV表示。
-
W2W-BEV方法通过将BEV嵌入和地面特征分割成固定窗口,基于上下文感知的窗口匹配策略选择最相似的地面窗口。
-
在匹配的BEV和地面窗口之间执行交叉注意力以学习稳健的BEV表示。
-
使用地面特征和预测的深度信息初始化BEV嵌入,以帮助学习更强大的BEV表示。
-
实验结果表明,W2W-BEV方法在未知方向和有限视野的条件下相较于先前的方法具有显著优势。
-
在CVUSA数据集上,W2W-BEV在R@1准确性方面将准确率从47.24%提高到64.73%(+17.49%)。
➡️