ActNetFormer:半监督视频动作识别的 Transformer-ResNet 混合方法

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本论文提出了一种基于生成对抗网络的动作识别框架,使用深度卷积生成对抗网络进行无监督学习,并通过有标签数据集进行微调,实现准确识别人类活动的半监督学习。该方法在半监督动作识别方面表现优异。

🎯

关键要点

  • 提出了一种基于生成对抗网络的动作识别框架。
  • 使用深度卷积生成对抗网络进行无监督学习。
  • 通过有标签数据集对已训练的鉴别器进行微调。
  • 实现了准确识别人类活动的半监督学习。
  • 找到了好的网络架构和超参数以最大化鉴别器的效果。
  • 该方法在半监督动作识别方面表现优异,达到UCF101和HMDB51等数据集的优劣表现。
➡️

继续阅读