μgat:通过提供多页上下文来改善单页文档解析
原文中文,约400字,阅读约需1分钟。发表于: 。本研究针对如何在解析文档时有效处理包含视觉信息的复杂结构性文档中的单页限制问题。我们提出了一种名为μgat的创新模型,它扩展了现有的解析架构Nougat,使其能够在解析当前页时考虑上下文中的前一页和后一页。实验结果表明,该方法在处理罗马教皇注册摘要等复杂文档时有效,提高了文档解析的准确性和效率。
EXO-POPP项目建立了一个包含法国巴黎及其郊区1880年至1940年婚姻记录的数据库。M-POPP数据集用于手写和印刷文件的文本识别和信息提取,并已公开提供。Esposalles展示了该架构的信息提取能力,并评估了不同的命名实体编码策略对全页性能的影响。