BanglaNet:使用卷积神经网络集成的孟加拉手写字符识别
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种基于CNN-BiLSTM系统的英文手写体识别解决方案,通过在公共IAM数据集上评估发现,采用CTC层的CNN-BiLSTM网络能够达到较低的错误率。同时,通过旋转和平移变换的测试时间增强方式,可以提高难识别情况下的识别率。此外,还对IAM数据集上的误差进行了分析,并提供了源代码以促进进一步的研究。
🎯
关键要点
- 提出了一种基于CNN-BiLSTM系统的英文手写体识别解决方案。
- 在公共IAM数据集上评估,采用CTC层的CNN-BiLSTM网络达到了3.59%的CER和9.44%的WER。
- 通过旋转和平移变换的测试时间增强方式,提高了难识别情况下的识别率,降低了单词错误率2.5个百分点。
- 对IAM数据集上的误差进行了分析,展示了手写图像中的难点,并探索了标签错误的样本。
- 提供源代码以促进进一步的研究,鼓励科学可重复性。
➡️