SEMv3: 表格分隔线检测的快速稳健方法
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究提出了一种基于Transformer的半监督表格检测器,通过新的匹配策略提高了伪标签质量,提高了训练效率。在多个数据集上评估,结果显示该方法在表格检测方面表现优秀。
🎯
关键要点
-
本研究提出了一种基于Transformer的半监督表格检测器。
-
通过新的匹配策略提高了伪标签质量和训练效率。
-
该方法在多个基准数据集上进行了评估,包括PubLayNet、ICADR-19和TableBank。
-
在TableBank和PubLayNet数据集上以30%标签数据实现了95.7%和97.9%的mAP。
-
相较于之前的半监督表格检测方法,分别提升了7.4和7.6个百分点。
-
结果显示该方法在表格检测方面表现优秀,超越现有所有先进方法。
-
该研究为实际文档分析任务提供了更高效准确的解决方案。
➡️