KITAB-Bench:阿拉伯语光学字符识别和文档理解的综合多领域基准
📝
内容提要
本研究解决了阿拉伯语光学字符识别(OCR)领域的评估体系不足,提出了KITAB-Bench基准,包含8809个样本,覆盖多达9个主要领域及36个子领域。研究发现,现代视觉语言模型在字符错误率方面较传统OCR方法提高了60%的性能,为阿拉伯文档分析提供了一个系统的评估框架,促进该领域的发展。
🏷️
标签
➡️