检索增强式布局变换器用于内容感知布局生成

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了一种名为READ的新框架,利用递归自动编码器生成多样的文档布局,并通过学习文档数据集的结构分解和边界框标注,获得结构表示形式,并将其映射到高斯空间,生成新的文本布局。同时,引入组合度量来测量文档布局之间的结构相似性,并在文本检测任务中证明了所生成布局的作用。

🎯

关键要点

  • 提出了一种名为READ的新框架
  • 利用递归自动编码器生成多样的文档2D布局
  • 采用递归方法提取文档的结构分解
  • 利用标注边界框的文档数据集进行学习
  • 获得结构表示形式并映射到高斯空间
  • 生成新的文本布局
  • 引入组合度量测量文档布局之间的结构相似性
  • 证明所生成文档布局的高可变性和实际性
  • 在文本检测任务中验证所生成布局的作用
➡️

继续阅读