为西里尔手写文字的 OCR 后修正生成数据

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本文介绍了一个无限制的二元分类器,通过引入与文本进行比较的任务,使用手写识别特征提取器和多模态分类头,将特征提取器的输出与输入文本的向量表示进行卷积。通过使用生成对抗网络创建的合成数据进行训练,证明了该分类器相比直接使用手写识别模型解决任务,可以保持高回收率的同时进行校准,提高了平均精确度19.5%。这种性能提升可以在人-环自动化应用中带来显著的生产力增长。

原文中文,约300字,阅读约需1分钟。
阅读原文