使用数据增强的嵌套命名实体识别的复合嵌套学习
原文中文,约300字,阅读约需1分钟。发表于: 。本研究关注于基于嵌套命名实体识别(NNER)来解决实体重叠识别的问题,提出了一种有效的数据增强方法,使用 Composited-Nested-Label Classification(CNLC)来建模嵌套实体,通过 Composited-Nested-Learning(CNL)对数据集进行扩充,并采用 Confidence Filtering...
本研究提出了一种新的混合标注方法,结合人力和大型语言模型,提高NER模型性能,解决传统标注方法的噪音和类别不平衡问题。通过多个数据集的分析,该方法在受限预算条件下始终表现出比传统标注方法更优越的性能,证明了以经济方式实现高性能NER的可行性。