双输入流变压器用于眼动线路分配
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文提出一种基于点云的两人交互识别网络,通过时间间隔帧采样(IFS)高效选取视频帧,提取特征,并用transformer实现自注意力机制分类。在NTU RGB+D数据集上的实验结果优于现有方法。
🎯
关键要点
- 提出了一种基于点云的两人交互识别网络。
- 采用时间间隔帧采样(IFS)方法高效选择视频帧。
- 通过帧特征学习模块和两流多级特征聚合模块提取全局和局部特征。
- 有效表示与交互相关的局部区域空间信息、外观信息和动作信息。
- 应用transformer实现自注意力机制进行最终分类。
- 在NTU RGB+D 60和NTU RGB+D 120数据集上实验结果优于现有方法。
➡️