Sign Language Recognition from Multiple Views Using Ensemble Learning
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究通过集成学习和多维视频Swin Transformer模型,解决了传统孤立手语识别中视角单一的问题,提升了模型在不同视角下的鲁棒性和泛化能力,并在相关比赛中获得第三名。
🎯
关键要点
- 本研究解决了传统孤立手语识别中视角单一的问题。
- 现有数据集主要基于正面视角捕捉手语视频,现实中摄像角度多样。
- 通过应用集成学习方法,增强了模型在不同视图下的鲁棒性与泛化能力。
- 我们的解决方案在RGB和RGB-D基础的孤立手语识别比赛中分别获得了第三名。
- 展示了在交视识别挑战中的有效性。
🏷️
标签
➡️