ActNetFormer:半监督视频动作识别的 Transformer-ResNet 混合方法
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本论文提出了一种基于生成对抗网络的动作识别框架,使用深度卷积生成对抗网络进行无监督学习,并通过有标签数据集进行微调,实现准确识别人类活动的半监督学习。该方法在半监督动作识别方面表现优异。
🎯
关键要点
- 提出了一种基于生成对抗网络的动作识别框架。
- 使用深度卷积生成对抗网络进行无监督学习。
- 通过有标签数据集对已训练的鉴别器进行微调。
- 实现了准确识别人类活动的半监督学习。
- 找到了好的网络架构和超参数以最大化鉴别器的效果。
- 该方法在半监督动作识别方面表现优异,达到UCF101和HMDB51等数据集的优劣表现。
➡️