AnnoPage数据集:具有细粒度分类的文档非文本元素数据集

该研究针对文档布局分析和对象检测的研究缺乏高质量标注数据的问题,提出了AnnoPage数据集,包含7550页历史文档的非文本元素,并将其细分为25类。通过专家图书馆员的精确标注,该数据集为未来研究提供了基准结果,并且公开可用,具有重要的参考价值。

发表于:
阅读原文