我们提出了一种新的视觉位置识别框架,利用鸟瞰视角的结构线索生成描述符。在VPR-NuScenes数据集上,Recall@1提高了2.47%,难样本上提高了18.06%。
该论文提出了一种使用结构线索来增强基于图像的位置识别的方法,通过将2D卷积神经网络与从结构运动点云导出的体素网格作为输入的3D CNN相结合来完成。最终得到了最佳性能。在牛津机器人车数据集上,该方法的表现优于仅从一个输入模态性提取的描述符,包括最先进的基于图像的描述符。在低描述符维度下,该方法的表现超过最先进的描述符高达90%。
完成下面两步后,将自动完成登录并继续当前操作。