EXO-POPP项目建立了一个包含法国巴黎及其郊区1880年至1940年婚姻记录的数据库。M-POPP数据集用于手写和印刷文件的文本识别和信息提取,并已公开提供。Esposalles展示了该架构的信息提取能力,并评估了不同的命名实体编码策略对全页性能的影响。
EXO-POPP项目旨在建立一个包含法国巴黎及其郊区1880年至1940年之间的30万份婚姻记录的综合数据库。该论文介绍了M-POPP数据库的一个子集,用于手写和印刷文件的全页文本识别和信息提取,并已公开提供。通过从页面图像直接进行手写文本识别和信息提取,提出了一种完整的端到端架构,并将其作为M-POPP数据集的基准。还评估并比较了不同的命名实体编码策略对识别手写文本和提取信息的全页性能的影响。
完成下面两步后,将自动完成登录并继续当前操作。