全向开放词汇 360 度图像生成的自回归全感知扩展绘画
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文研究了利用360°图像进行视觉目标追踪的新挑战,提出了边界视野作为目标定位表示方式,并引入了通用的360°追踪框架。通过评估20种视觉追踪算法,提供了360VOT数据集和新的度量标准。
🎯
关键要点
- 研究利用360°图像进行视觉目标追踪的新挑战。
- 提出边界视野作为目标定位表示方式。
- 引入通用的360°追踪框架,适用于全向追踪。
- 推出360VOT数据集,包含120个不同场景的113K个高分辨率帧。
- 追踪目标涵盖32个类别。
- 提供4种无偏的基准数据,包括旋转的边界框和边界视野。
- 提出适用于360°图像的新度量标准,以准确评估全向追踪性能。
- 对20种视觉追踪算法进行了广泛评估,并提供新的基准用于未来比较。
➡️