通过可学习的放松标签提升基于CNN的手写识别系统

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种基于CNN-BiLSTM系统的英文手写体识别解决方案,通过在公共IAM数据集上评估发现,采用CTC层的CNN-BiLSTM网络可以达到较低的错误率。作者还通过旋转和平移变换的测试时间增强方式提高了难识别情况下的识别率,并对IAM数据集上的误差进行了分析。提供源代码以促进进一步研究。

🎯

关键要点

  • 提出了一种基于CNN-BiLSTM系统的英文手写体识别解决方案。

  • 在公共IAM数据集上评估,采用CTC层的CNN-BiLSTM网络达到了3.59%的CER和9.44%的WER。

  • 通过旋转和平移变换的测试时间增强方式,提高了难识别情况下的识别率,降低了单词错误率2.5个百分点。

  • 对IAM数据集上的误差进行了分析,展示了手写图像中的难点,并探索了标签错误的样本。

  • 提供源代码以促进进一步研究,鼓励科学可重复性。

➡️

继续阅读