RanLayNet:一种用于领域自适应和泛化的文档布局检测数据集
原文中文,约400字,阅读约需1分钟。发表于: 。为了解决有限多样性数据集对深度学习模型的影响问题,我们引入了一个包含空间位置、范围和布局元素类型的标签的合成文档数据集 RanLayNet。经过实验证明,使用我们的数据集训练的深度布局识别模型相比仅使用实际文档训练的模型表现更优。此外,我们通过对 Doclaynet 数据集使用 PubLayNet 和 IIIT-AR-13K...
为了解决深度学习模型在有限多样性数据集上的问题,研究人员引入了合成文档数据集RanLayNet,该数据集包含空间位置、范围和布局元素类型标签。实验证明,使用该数据集训练的深度布局识别模型表现更优,同时在科学文档领域的TABLE类任务中取得了较高的mAP95分数。