弱监督下的少于单次投射:命名实体识别
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该论文提出了一种基于 transformer 的方法,用于解决生物医学领域中监督命名实体识别(NER)的挑战,包括零样本和少样本 NER。该方法在更多数据集和医学实体上预训练,具有识别有限样本中的新实体的能力。对于零样本 NER,平均 F1 得分为 35.44%,对于 10 样本和 100 样本 NER,平均 F1 得分分别为 69.94%和 79.51%。该方法可与目前的先进零样本和少样本 NER 方法相媲美甚至更好。
🎯
关键要点
- 该论文提出了一种基于 transformer 的方法解决生物医学领域中的监督命名实体识别(NER)挑战。
- 方法包括零样本和少样本 NER,基于将多类令牌分类转化为二进制令牌分类。
- 在更多数据集和医学实体上预训练,学习实体与潜在类之间的语义关系。
- 使用 PubMedBERT 调整模型进行实验,零样本 NER 的平均 F1 得分为 35.44%。
- 10 样本和 100 样本 NER 的平均 F1 得分分别为 69.94% 和 79.51%。
- 该方法与目前的先进零样本和少样本 NER 方法相媲美甚至更好。
➡️