XS-VID: 一个极小的视频物体检测数据集

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

XS-VID数据集是为了解决小视频物体检测方法应用场景单一的问题而开发的,包括不同时期和场景的航拍数据,并对八个主要物体类别进行了注释。验证结果显示,现有方法在小物体检测方面存在困难,性能低于普通物体检测器。提出了YOLOFT方法,提高了SVOD的准确性和稳定性。

🎯

关键要点

  • XS-VID数据集旨在解决小视频物体检测方法应用场景单一的问题。
  • 数据集包括不同时期和场景的航拍数据,并对八个主要物体类别进行了注释。
  • XS-VID广泛采集了三种具有较小像素面积的物体,提供了前所未有的广度和深度。
  • 验证结果显示,现有方法在小物体检测方面存在困难,性能低于普通物体检测器。
  • 提出了YOLOFT方法,增强了局部特征关联并整合了时间运动特征,提高了SVOD的准确性和稳定性。
  • 数据集和基准可在指定网址获取。
➡️

继续阅读