在小样本临床实体识别中保持BERT的经验概率
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了命名实体识别(NER)中标签不平衡的问题,即某些实体类型在真实数据集中表现过度,而其他类型表现不足,导致模型偏差。论文提出了一种新颖的方法,通过分析损失计算和传播机制,改善基于BERT的模型在小样本临床实体识别中的表现,以提高对少数实体类别的识别准确性。
本论文提出了一种基于transformer的方法来解决生物医学领域中监督命名实体识别的挑战,包括零样本和少样本NER。实验结果表明,该方法具有识别有限样本中的新实体的能力,对于零样本NER的平均F1得分达到35.44%,对于10样本和100样本NER的平均F1得分分别为69.94%和79.51%。该方法可与目前的先进零样本和少样本NER方法相媲美甚至更好。