DAViD:基于合成见解的领域自适应视觉丰富文档理解

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文研究结合大型预训练语言模型和图神经网络来编码视觉和文本信息,通过未标记数据进行无监督微调。在发票和简历数据集上,发票的F1值提高了6.3%,简历提高了4.7%。在少样本情况下,所需标注数据比基线少30倍即可达到约90%的F1性能。

🎯

关键要点

  • 本文研究信息提取的问题,结合大型预训练语言模型和图神经网络。

  • 通过使用大量未标记的领域内数据来改善无监督微调。

  • 在发票数据集上,所提出的方法F1值比强文本基线高出6.3%。

  • 在简历数据集上,F1值绝对值增加了4.7%。

  • 在少样本情况下,所需标注数据比基线少30倍即可达到约90%的F1性能。

➡️

继续阅读