从生物医学文献中进行意图识别和实体提取
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本论文提出了一种基于transformer的方法来解决生物医学领域中的NER挑战,包括零样本和少样本NER。实验结果表明,该方法具有识别有限样本中的新实体的能力,对于零样本NER的平均F1得分达到35.44%,对于10样本和100样本NER的平均F1得分分别为69.94%和79.51%。该方法与目前的先进方法相媲美甚至更好。
🎯
关键要点
- 提出了一种基于transformer的方法来解决生物医学领域中的NER挑战。
- 该方法包括零样本和少样本NER的处理。
- 通过将多类令牌分类转化为二进制令牌分类来实现。
- 在更多数据集和医学实体上进行预训练,以学习实体和潜在类之间的语义关系。
- 使用PubMedBERT调整模型进行实验,零样本NER的平均F1得分为35.44%。
- 10样本和100样本NER的平均F1得分分别为69.94%和79.51%。
- 该方法与目前的先进方法相媲美甚至更好。
🏷️
标签
➡️