该论文提出了一种基于Transformer的端到端方法DLAFormer,用于文档布局分析。DLAFormer整合了多个文档布局分析任务,包括图形页面对象检测、文本区域检测、逻辑角色分类和阅读顺序预测。通过将这些任务视为关系预测问题,并采用统一标签空间方法,DLAFormer能够同时有效地处理这些任务。实验结果表明,DLAFormer在文档布局分析基准测试中表现优于先前的方法。
完成下面两步后,将自动完成登录并继续当前操作。