基于大语言模型的远程监督半自动文档级关系抽取数据增强

通过集成大型语言模型和自然语言推理模块,我们提出一种自动标注方法来生成关系三元组,从而增强文档级关系数据集,我们通过介绍增强的数据集 DocGNRE 展示了我们方法的有效性,该方法在重新注释众多长尾关系类型方面表现出色,并且在推进广义语言语义理解方面提供了实际好处。

本研究提出了GPT-RE方法,用于改善大型语言模型在关系提取任务中的表现,通过特定实体和黄金标签引导逻辑,该方法在四个数据集上超越GPT-3基线,在Semeval和SciERC上达到最佳状态。

原文中文,约200字,阅读约需1分钟。发表于:
阅读原文