基于多尺度时空自注意力图卷积网络的基于骨架的动作识别

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本研究提出了一种名为多尺度时空自注意力网络的混合模型,通过使用自注意力图卷积网络技术,有效提高建模能力,并在多个数据集上取得了最先进的结果。该模型利用自空间和自时间注意力模块,捕获节点间的关系和帧间的相关性,通过多尺度卷积网络组合成高层次的时空表示,并使用 softmax 分类器输出预测的动作。

🎯

关键要点

  • 本研究提出了一种名为多尺度时空自注意力网络的混合模型。
  • 该模型通过自注意力图卷积网络技术提高建模能力。
  • 在多个数据集上取得了最先进的结果。
  • 模型利用自空间注意力模块理解帧内不同身体部位之间的关系。
  • 利用自时间注意力模块研究节点帧之间的相关性。
  • 通过多尺度卷积网络捕获节点的长程时空依赖关系。
  • 将节点组合成高层次的时空表示,并使用softmax分类器输出预测的动作。
➡️

继续阅读