Triplètoile:从微博文本中提取知识
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种超参数信息提取方法(HyperPIE),通过实体识别和关系提取任务,从计算机科学学科的出版物中提取信息。使用BERT等模型进行训练和评估,提出了一种关系提取方法,改善了29%的F1值。同时,利用YAML输出进行结构化数据提取的方法在实体识别上相对于JSON平均提高了5.5%的F1值。通过最佳性能模型,从未标注的论文中提取了超参数信息,并分析了学科间的模式。
🎯
关键要点
- 自动提取科学出版物中的信息对于科学知识的可读化至关重要。
- 本文提出了一种超参数信息提取方法(HyperPIE),形式化为实体识别和关系提取任务。
- 基于计算机科学学科的出版物创建了一个标记数据集,使用BERT等模型进行训练和评估。
- 提出的关系提取方法在有限调整模型上实现了29%的F1值改善。
- 使用YAML输出进行结构化数据提取的方法在实体识别上相对于JSON平均提高了5.5%的F1值。
- 通过最佳性能模型,从未标注的论文中提取了超参数信息,并分析了学科间的模式。
➡️