SEMv3: 表格分隔线检测的快速稳健方法

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本研究提出了一种基于Transformer的半监督表格检测器,通过新的匹配策略提高了伪标签质量,提高了训练效率。在多个数据集上评估,结果显示该方法在表格检测方面表现优秀。

🎯

关键要点

  • 本研究提出了一种基于Transformer的半监督表格检测器。

  • 通过新的匹配策略提高了伪标签质量和训练效率。

  • 该方法在多个基准数据集上进行了评估,包括PubLayNet、ICADR-19和TableBank。

  • 在TableBank和PubLayNet数据集上以30%标签数据实现了95.7%和97.9%的mAP。

  • 相较于之前的半监督表格检测方法,分别提升了7.4和7.6个百分点。

  • 结果显示该方法在表格检测方面表现优秀,超越现有所有先进方法。

  • 该研究为实际文档分析任务提供了更高效准确的解决方案。

➡️

继续阅读