为西里尔手写文字的 OCR 后修正生成数据

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一个无限制的二元分类器,通过引入与文本进行比较的任务,使用手写识别特征提取器和多模态分类头,将特征提取器的输出与输入文本的向量表示进行卷积。通过使用生成对抗网络创建的合成数据进行训练,证明了该分类器相比直接使用手写识别模型解决任务,可以保持高回收率的同时进行校准,提高了平均精确度19.5%。这种性能提升可以在人-环自动化应用中带来显著的生产力增长。

🎯

关键要点

  • 提出了一个无限制的二元分类器,结合手写识别特征提取器和多模态分类头。

  • 分类头通过卷积将特征提取器的输出与输入文本的向量表示结合。

  • 模型使用生成对抗网络创建的合成数据进行训练。

  • 与直接使用手写识别模型相比,分类器在保持高回收率的同时,平均精确度提高了19.5%。

  • 这种性能提升可在自动化应用中显著提高生产力。

➡️

继续阅读