尼泊尔语和孟加拉语的光学文本识别:基于 Transformer 的方法
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该研究提出了一种孟加拉语OCR系统,能够准确提取文本并重建文档布局。该系统适应多种文档类型,包括计算机排版、凸版印刷、打字机和手写文档,并能处理静态和动态手写输入。该系统还能识别孟加拉语中的复合字符,并具有图像、标志、签名和表格识别等额外功能。
🎯
关键要点
- 该研究提出了一种孟加拉语OCR系统,能够准确提取文本并重建文档布局。
- 系统适应多种文档类型,包括计算机排版、凸版印刷、打字机和手写文档。
- 能够处理静态和动态手写输入,识别各种写作风格。
- 系统识别孟加拉语中的复合字符。
- 广泛的数据收集提供了多样化的语料库,优化了字符和单词识别。
- 额外功能包括图像、标志、签名和表格识别,透视校正和布局重建。
- 系统在高效准确的文本提取和分析方面表现出色。
➡️