Sign Language Recognition from Multiple Views Using Ensemble Learning

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究通过集成学习和多维视频Swin Transformer模型,解决了传统孤立手语识别中视角单一的问题,提升了模型在不同视角下的鲁棒性和泛化能力,并在相关比赛中获得第三名。

🎯

关键要点

  • 本研究解决了传统孤立手语识别中视角单一的问题。
  • 现有数据集主要基于正面视角捕捉手语视频,现实中摄像角度多样。
  • 通过应用集成学习方法,增强了模型在不同视图下的鲁棒性与泛化能力。
  • 我们的解决方案在RGB和RGB-D基础的孤立手语识别比赛中分别获得了第三名。
  • 展示了在交视识别挑战中的有效性。
➡️

继续阅读