360Loc: 用于跨设备查询的全景视觉定位数据集和基准
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了利用360°图像进行视觉目标追踪的新方法,提出了边界视野的目标定位表示方式和通用的360°追踪框架。作者还提供了一个大规模全向追踪基准数据集360VOT,包含120个场景中的序列和32个类别的追踪目标。对20种最先进的视觉追踪算法进行了评估,并提供了新的基准。
🎯
关键要点
- 本文研究如何利用360°图像进行视觉目标追踪。
- 提出了边界视野的目标定位表示方式,以应对大变形和拼接伪影等挑战。
- 引入了一个通用的360°追踪框架,适用于全向追踪。
- 推出了360VOT数据集,包含120个场景的113K个高分辨率等距投影帧,涵盖32个类别的追踪目标。
- 提供了4种无偏的基准数据,包括旋转的边界框和边界视野。
- 提出了适用于360°图像的新度量标准,以准确评估全向追踪性能。
- 对20种最先进的视觉追踪算法进行了评估,并提供了新的基准。
➡️