借助粗粒度数据提升低资源细粒度命名实体识别
原文中文,约200字,阅读约需1分钟。发表于: 。利用现有粗粒度数据集进行预精调,通过细粒度实体类型与粗粒度实体类型之间的映射矩阵以及不一致过滤方法,解决细粒度命名实体识别缺少标注数据的问题,并在实验中证明在处理少量细粒度标注时,该方法优于 $K$-shot 学习和有监督学习方法。
本文提出了一种基于词典的实体检索器,可消除实体重名的歧义性。实验结果表明,该方法在中文 Few-shot 和 Zero-shot 实体链接的 NLPCC 2023 共享任务 6 中名列第一。