基于变换器的词级孟加拉手语识别:相对量化编码方法
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了BdSLW401数据集,包含401个手势和102,176个视频样本,旨在解决孟加拉手语识别中的变异和数据集限制。通过相对量化编码(RQE)显著提升了识别效果。
🎯
关键要点
- 提出了BdSLW401数据集,包含401个手势和102,176个视频样本。
- 旨在解决孟加拉手语识别中的说话者变异、视角变化和有限注释数据集的挑战。
- 引入相对量化编码(RQE),显著提高了基于变换器的手语识别效果。
- RQE方法通过降低空间变异性,提升了模型的解释性。
- 在多个测试集上实现了显著的识别率提升。
➡️