基于多尺度时空自注意力图卷积网络的基于骨架的动作识别
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究提出了一种名为多尺度时空自注意力网络的混合模型,通过使用自注意力图卷积网络技术,有效提高建模能力,并在多个数据集上取得了最先进的结果。该模型利用自空间和自时间注意力模块,捕获节点间的关系和帧间的相关性,通过多尺度卷积网络组合成高层次的时空表示,并使用 softmax 分类器输出预测的动作。
🎯
关键要点
- 本研究提出了一种名为多尺度时空自注意力网络的混合模型。
- 该模型通过自注意力图卷积网络技术提高建模能力。
- 在多个数据集上取得了最先进的结果。
- 模型利用自空间注意力模块理解帧内不同身体部位之间的关系。
- 利用自时间注意力模块研究节点帧之间的相关性。
- 通过多尺度卷积网络捕获节点的长程时空依赖关系。
- 将节点组合成高层次的时空表示,并使用softmax分类器输出预测的动作。
➡️