阿拉伯细粒度实体识别
原文中文,约400字,阅读约需1分钟。发表于: 。该研究论文旨在通过扩展 Wojood(一种开源的阿拉伯语嵌套命名实体语料库)的细分类型,提升阿拉伯语 NER 的准确性和细粒度,通过改变 Wojood 的注释,手动标注扩展 Wojood,并在三种设置下使用预训练的阿拉伯 BERT 编码器计算 WojoodFine 的基准,其 F1 分数分别为 0.920, 0.866, 和 0.885。
该研究介绍了 SemEval-2023 Task 2 的发现,该任务主要聚焦于跨越 12 种语言的复杂名词实体的识别方法。MultiCoNER 2 是 SemEval-2023 中最受欢迎的任务之一,发现了媒体标题和产品名称是最具挑战性的实体类型,并提出了将外部知识融入 transformer 模型中来实现最佳表现的方法。同时,该研究注意到嘈杂的数据对模型性能有重要影响,未来需要关注嘈杂数据中包含的复杂实体的 NER 鲁棒性。