SOAP:增强少样本动作识别的时空关系和动作信息捕获

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该文章介绍了一种简单而有效的语义感知少样本动作识别模型(SAFSAR),通过利用3D特征提取器和特征融合方案,以及简单的余弦相似度分类,实现了更好的性能。该模型在各种设置下对五个具有挑战性的少样本动作识别基准进行了实验证明,显著提高了最先进的性能。

🎯

关键要点

  • 提出了一种简单而有效的语义感知少样本动作识别模型(SAFSAR)。
  • SAFSAR利用3D特征提取器和有效的特征融合方案,结合余弦相似度分类,提升性能。
  • 该模型无需复杂的距离函数和额外的时间建模组件。
  • SAFSAR以紧凑的方式编码文本语义,进行视频表示的自适应特征融合。
  • 鼓励视觉编码器提取更具语义一致性的特征。
  • 在多种设置下对五个少样本动作识别基准进行实验证明,显著提高了最先进的性能。
➡️

继续阅读