利用前沿的基于深度学习的图像匹配技术重建稀疏图像中的大场景
原文中文,约400字,阅读约需1分钟。发表于: 。我们提出了一个在 AISG-SLA 视觉定位挑战竞赛中获得第一名的解决方案,该任务是估计通过一个车载相机在城市场景中连续拍摄的图像之间的相对运动。我们使用我们最近基于深度学习的匹配器 RoMa 对图像进行匹配,并从中样本点进行相对运动估计,取得了非常有竞争力的成绩 - 在挑战竞赛中排名第三。为了提高估计准确度,我们提取图像中的关键点,使用 RoMa 进行匹配,并使用 COLMAP...
该文介绍了在 AISG-SLA 视觉定位挑战竞赛中获得第一名的解决方案。作者使用基于深度学习的匹配器 RoMa 对图像进行匹配,并从中样本点进行相对运动估计,取得了非常有竞争力的成绩。为了提高估计准确度,作者提取图像中的关键点,并使用 COLMAP 进行结构运动重建。此外,作者使用 DINOv2 进行图像检索,并匹配特定的非连续图像对,解决了图像序列中的时间跳跃问题。这些改进使得作者的解决方案超过了所有竞争对手。