视频目标检测的一致身份聚合
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究提出了一种基于全序列级别的特征聚合方法(SELSA),用于视频目标检测。该方法在 ImageNet VID 和 EPIC KITCHENS 数据集上取得了最先进的结果。
🎯
关键要点
- 提出了一种基于全序列级别的特征聚合方法(SELSA)用于视频目标检测。
- 该方法实现了更具区分性和更健壮的特征。
- 创造了新的视角来理解视频目标检测问题。
- 不需要复杂的后处理方法,如 Seq-NMS 或 Tubelet 重评分。
- 保持了管道的简洁明了。
- 在 ImageNet VID 和 EPIC KITCHENS 数据集上取得了最先进的结果。
➡️