本文介绍了一种新型场景文本识别方法,基于卷积特征映射的字符模型,能够有效识别未知单词并避免字符分割困难。研究展示了该方法在复杂文本图像中的优越性能,尤其在手写文本识别和多语言OCR系统中表现突出。
本文研究了手写文本与印刷文本重叠造成的光学字符识别(OCR)和数字化过程中的困难,并引入了一个新的数据集和模型,以改善对重叠部分的识别性能。最佳配置的IoU得分相较于先前的工作,在两个不同的数据集上分别提高了17.9%和7.3%。
完成下面两步后,将自动完成登录并继续当前操作。