ASTRA:一种用于足球视频的动作检测 Transformer
💡
原文中文,约500字,阅读约需1分钟。
📝
内容提要
ASTRA是一个基于Transformer的模型,用于足球比赛中的动作识别任务。它解决了动作定位、长尾数据分布、不可见动作和标签噪声等问题,实现了精确预测和高效检测。在测试集上取得了66.82的紧密平均mAP,在SoccerNet 2023动作识别挑战中获得了第三名。
🎯
关键要点
- ASTRA是一个基于Transformer的模型,专门用于足球比赛中的动作识别任务。
- ASTRA解决了精确动作定位、长尾数据分布、不可见动作和标签噪声等问题。
- 使用Transformer编码器解码器架构实现所需的输出时间分辨率和精确预测。
- 采用平衡的混合策略处理数据的长尾分布。
- 使用不确定性感知的位移头捕获标签的可变性。
- 输入音频信号增强对不可见动作的检测。
- 在测试集上取得了66.82的紧密平均mAP。
- 在SoccerNet 2023动作识别挑战中获得了第三名,平均mAP为70.21。
🏷️
标签
➡️