360Loc: 用于跨设备查询的全景视觉定位数据集和基准

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了利用360°图像进行视觉目标追踪的新方法,提出了边界视野的目标定位表示方式和通用的360°追踪框架。作者还提供了一个大规模全向追踪基准数据集360VOT,包含120个场景中的序列和32个类别的追踪目标。对20种最先进的视觉追踪算法进行了评估,并提供了新的基准。

🎯

关键要点

  • 本文研究如何利用360°图像进行视觉目标追踪。
  • 提出了边界视野的目标定位表示方式,以应对大变形和拼接伪影等挑战。
  • 引入了一个通用的360°追踪框架,适用于全向追踪。
  • 推出了360VOT数据集,包含120个场景的113K个高分辨率等距投影帧,涵盖32个类别的追踪目标。
  • 提供了4种无偏的基准数据,包括旋转的边界框和边界视野。
  • 提出了适用于360°图像的新度量标准,以准确评估全向追踪性能。
  • 对20种最先进的视觉追踪算法进行了评估,并提供了新的基准。
➡️

继续阅读