为西里尔手写文字的 OCR 后修正生成数据
原文中文,约300字,阅读约需1分钟。发表于: 。该论文介绍了一种针对手写西里尔文文本的后光学字符识别校正(POC)的新方法,该方法利用 Bézier 曲线生成引擎生成高度逼真的手写文本,并应用手写文本识别模型识别 OCR 错误,从而进行校正。
本文介绍了一个无限制的二元分类器,通过引入与文本进行比较的任务,使用手写识别特征提取器和多模态分类头,将特征提取器的输出与输入文本的向量表示进行卷积。通过使用生成对抗网络创建的合成数据进行训练,证明了该分类器相比直接使用手写识别模型解决任务,可以保持高回收率的同时进行校准,提高了平均精确度19.5%。这种性能提升可以在人-环自动化应用中带来显著的生产力增长。