分割混乱文本:检测从历史报纸影像中提取的文本边界

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文研究了手写文本与印刷文本重叠造成的光学字符识别(OCR)和数字化过程中的困难,并引入了一个新的数据集和模型,以改善对重叠部分的识别性能。最佳配置的IoU得分相较于先前的工作,在两个不同的数据集上分别提高了17.9%和7.3%。

🎯

关键要点

  • 研究手写文本与印刷文本重叠对光学字符识别(OCR)的影响
  • 引入新的数据集和模型以改善重叠部分的识别性能
  • 最佳配置的IoU得分在两个不同的数据集上分别提高了17.9%和7.3%
➡️

继续阅读