该论文提出了一种基于Transformer的端到端方法DLAFormer,用于文档布局分析。DLAFormer整合了多个文档布局分析任务,包括图形页面对象检测、文本区域检测、逻辑角色分类和阅读顺序预测。通过将这些任务视为关系预测问题,并采用统一标签空间方法,DLAFormer能够同时有效地处理这些任务。实验结果表明,DLAFormer在文档布局分析基准测试中表现优于先前的方法。
该论文研究了文档布局分析,使用基于Transformer的对象检测网络进行图形页面对象检测,提高了解码器效率。实验结果表明,该方法在基准测试上表现优秀,提高了文档转换和信息检索的能力。
完成下面两步后,将自动完成登录并继续当前操作。