A Chinese Continuous Sign Language Dataset Based on Complex Environments
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本文构建了一个包含5,988个日常生活场景的视频片段的中文连续手语数据集(CE-CSL),旨在解决现有数据集缺乏多样性的问题。同时,提出了一种新的时间-频率网络(TFNet)模型,显著提升了复杂背景下的手语识别性能。
🎯
关键要点
- 当前连续手语识别研究面临的瓶颈是大多数公开数据集局限于实验室环境或电视节目录制。
- 现有数据集缺乏真实场景的多样性和复杂性。
- 本文构建了一个包含5,988个日常生活场景的视频片段的中文连续手语数据集(CE-CSL)。
- 提出了一种新的时间-频率网络(TFNet)模型,显著提升了复杂背景下的手语识别性能。
➡️