尼泊尔语和孟加拉语的光学文本识别:基于 Transformer 的方法

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该研究提出了一种孟加拉语OCR系统,能够准确提取文本并重建文档布局。该系统适应多种文档类型,包括计算机排版、凸版印刷、打字机和手写文档,并能处理静态和动态手写输入。该系统还能识别孟加拉语中的复合字符,并具有图像、标志、签名和表格识别等额外功能。

🎯

关键要点

  • 该研究提出了一种孟加拉语OCR系统,能够准确提取文本并重建文档布局。
  • 系统适应多种文档类型,包括计算机排版、凸版印刷、打字机和手写文档。
  • 能够处理静态和动态手写输入,识别各种写作风格。
  • 系统识别孟加拉语中的复合字符。
  • 广泛的数据收集提供了多样化的语料库,优化了字符和单词识别。
  • 额外功能包括图像、标志、签名和表格识别,透视校正和布局重建。
  • 系统在高效准确的文本提取和分析方面表现出色。
➡️

继续阅读