通过可学习的放松标签提升基于CNN的手写识别系统
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了手写识别系统中长距离上下文依赖管理困难的问题。通过将可训练的放松标签处理与成熟的神经架构相结合,提出了一种新方法,同时引入稀疏化技术加速算法的收敛并提升整体性能。实验结果表明,该方法能增强系统的泛化能力,甚至在某些情况下超越基于变换器的架构。
本文提出了一种基于CNN-BiLSTM系统的英文手写体识别解决方案,通过在公共IAM数据集上评估发现,采用CTC层的CNN-BiLSTM网络可以达到较低的错误率。作者还通过旋转和平移变换的测试时间增强方式提高了难识别情况下的识别率,并对IAM数据集上的误差进行了分析。提供源代码以促进进一步研究。