基于提示性数据编程的弱监督文档级关系抽取
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文研究了低资源情况下关系抽取系统的三种方案,并创建了包含8个数据集的基准。结果表明,数据增强和自我训练可以提高性能,但自我训练并不能始终实现低资源关系抽取的进步。提示的调整有助于低资源RE,但在从跨句子上下文中提取多个关系三元组时仍有改善潜力。
🎯
关键要点
- 研究了低资源情况下关系抽取系统的三种方案。
- 创建了包含8个RE数据集的基准。
- 不同的方法与结合对性能的影响被示范。
- 基于提示的调整有助于低资源RE。
- 在跨句子上下文中提取多个关系三元组时仍有改善潜力。
- 数据增强与自我训练可以提升性能。
- 自我训练并不能始终实现低资源关系抽取的进步。
➡️