基于变换器的词级孟加拉手语识别:相对量化编码方法

💡 原文中文,约700字,阅读约需2分钟。
📝

内容提要

本文提出了BdSLW401,一个包含401个手势和102,176个视频样本的孟加拉手语数据集,以解决手语识别中的说话者变异和视角变化问题。通过引入相对量化编码(RQE),显著提升了基于变换器的手语识别效果,增强了模型的解释性和识别率。

🎯

关键要点

  • BdSLW401是一个包含401个手势和102,176个视频样本的孟加拉手语数据集。
  • 该数据集旨在解决手语识别中的说话者变异和视角变化问题。
  • 引入相对量化编码(RQE)显著提升了基于变换器的手语识别效果。
  • RQE方法通过降低空间变异性,增强了模型的解释性和识别率。
➡️

继续阅读