ASTRA:一种用于足球视频的动作检测 Transformer

💡 原文中文,约500字,阅读约需1分钟。
📝

内容提要

ASTRA是一个基于Transformer的模型,用于足球比赛中的动作识别任务。它解决了动作定位、长尾数据分布、不可见动作和标签噪声等问题,实现了精确预测和高效检测。在测试集上取得了66.82的紧密平均mAP,在SoccerNet 2023动作识别挑战中获得了第三名。

🎯

关键要点

  • ASTRA是一个基于Transformer的模型,专门用于足球比赛中的动作识别任务。
  • ASTRA解决了精确动作定位、长尾数据分布、不可见动作和标签噪声等问题。
  • 使用Transformer编码器解码器架构实现所需的输出时间分辨率和精确预测。
  • 采用平衡的混合策略处理数据的长尾分布。
  • 使用不确定性感知的位移头捕获标签的可变性。
  • 输入音频信号增强对不可见动作的检测。
  • 在测试集上取得了66.82的紧密平均mAP。
  • 在SoccerNet 2023动作识别挑战中获得了第三名,平均mAP为70.21。
➡️

继续阅读