基于 StackOverflow 的小样本命名实体识别
原文中文,约200字,阅读约需1分钟。发表于: 。提出了 RoBERTa+MAML 方法,用于解决 StackOverflow 上的注释挑战,通过元学习来进行少样本命名实体识别,并在 StackOverflow 命名实体语料库上取得了 5% 的 F1 分数改进。通过增强领域特定短语处理来进一步提高结果。
本文提出了一种有效的方法来建立识别命名实体(NER)系统,通过自我监督预训练语言模型(PLMs)和三种正交方案改进模型的泛化能力。实验结果表明,该方法在少样例学习环境中优于基线方法,并在无训练和少样例学习环境下创造了最新的业界记录。