SOAP:增强少样本动作识别的时空关系和动作信息捕获
原文中文,约300字,阅读约需1分钟。发表于: 。本文提出了一种新颖的用于少样本动作识别的插拔式架构 SOAP(Spatio-tempOral frAme tuPle enhancer),该模型在包括 SthSthV2、Kinetics、UCF101 和 HMDB51 等多个基准数据集上取得了最新的最高性能,实验证明了其竞争力、可插拔性、泛化性和鲁棒性。
该文章介绍了一种简单而有效的语义感知少样本动作识别模型(SAFSAR),通过利用3D特征提取器和特征融合方案,以及简单的余弦相似度分类,实现了更好的性能。该模型在各种设置下对五个具有挑战性的少样本动作识别基准进行了实验证明,显著提高了最先进的性能。