基于变换器的词级孟加拉手语识别:相对量化编码方法

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了BdSLW401数据集,包含401个手势和102,176个视频样本,旨在解决孟加拉手语识别中的变异和数据集限制。通过相对量化编码(RQE)显著提升了识别效果。

🎯

关键要点

  • 提出了BdSLW401数据集,包含401个手势和102,176个视频样本。
  • 旨在解决孟加拉手语识别中的说话者变异、视角变化和有限注释数据集的挑战。
  • 引入相对量化编码(RQE),显著提高了基于变换器的手语识别效果。
  • RQE方法通过降低空间变异性,提升了模型的解释性。
  • 在多个测试集上实现了显著的识别率提升。
➡️

继续阅读