BanglaNet:使用卷积神经网络集成的孟加拉手写字符识别

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于CNN-BiLSTM系统的英文手写体识别解决方案,通过在公共IAM数据集上评估发现,采用CTC层的CNN-BiLSTM网络能够达到较低的错误率。同时,通过旋转和平移变换的测试时间增强方式,可以提高难识别情况下的识别率。此外,还对IAM数据集上的误差进行了分析,并提供了源代码以促进进一步的研究。

🎯

关键要点

  • 提出了一种基于CNN-BiLSTM系统的英文手写体识别解决方案。
  • 在公共IAM数据集上评估,采用CTC层的CNN-BiLSTM网络达到了3.59%的CER和9.44%的WER。
  • 通过旋转和平移变换的测试时间增强方式,提高了难识别情况下的识别率,降低了单词错误率2.5个百分点。
  • 对IAM数据集上的误差进行了分析,展示了手写图像中的难点,并探索了标签错误的样本。
  • 提供源代码以促进进一步的研究,鼓励科学可重复性。
➡️

继续阅读