本文探讨了手语识别技术的最新进展,重点介绍了连续手语识别(CSLR)和孤立手语识别(ISLR)方法。研究表明,关键点规范化、图卷积网络和多模态特征融合等技术显著提高了识别准确率,并在多个数据集上验证了其有效性。这些成果对低资源手语语言的研究具有重要意义。
本文研究了孤立手语识别(ISLR)的自监督学习方法,通过四种基于Transformer的方法和四种预训练数据方案在WLASL2000数据集上的组合进行了深入分析。发现MaskFeat在WLASL2000数据集上的准确率达到79.02%,证明了这些模型产生ASL手势表示的能力。同时强调了架构和预训练任务选择在ISLR中的重要性,特别是在WLASL2000数据集上验证了掩码重构预训练的强大性能和层次视觉Transformer在手语表示中的重要性。
完成下面两步后,将自动完成登录并继续当前操作。