全向开放词汇 360 度图像生成的自回归全感知扩展绘画

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文研究了利用360°图像进行视觉目标追踪的新挑战,提出了边界视野作为目标定位表示方式,并引入了通用的360°追踪框架。通过评估20种视觉追踪算法,提供了360VOT数据集和新的度量标准。

🎯

关键要点

  • 研究利用360°图像进行视觉目标追踪的新挑战。
  • 提出边界视野作为目标定位表示方式。
  • 引入通用的360°追踪框架,适用于全向追踪。
  • 推出360VOT数据集,包含120个不同场景的113K个高分辨率帧。
  • 追踪目标涵盖32个类别。
  • 提供4种无偏的基准数据,包括旋转的边界框和边界视野。
  • 提出适用于360°图像的新度量标准,以准确评估全向追踪性能。
  • 对20种视觉追踪算法进行了广泛评估,并提供新的基准用于未来比较。
➡️

继续阅读