一种用于密集多标签动作检测的有效高效方法

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于注意力机制的体系结构来模拟未修剪视频中动作类之间的关系,并通过分支建模依赖性,提出了新的度量标准,并在数据集上展示了更好的性能。

🎯

关键要点

  • 提出了一种基于注意力机制的体系结构
  • 模拟未修剪视频中动作类之间的关系
  • 通过 Co-发生依赖分支和时间依赖分支建模合作和临时依赖性
  • 提出了新颖的度量标准以考虑动作类之间的依赖性
  • 在 MultiTHUMOS 和 Charades 数据集上展示了更好的 f-mAP 性能
➡️

继续阅读