通用 NER:金标准多语言命名实体识别基准
原文中文,约300字,阅读约需1分钟。发表于: 。介绍了一个名为 Universal NER (UNER) 的开源项目,旨在开发多种语言的黄金标准 NER 基准;UNER 的目标是提供高质量的、跨语言一致的标注,以促进和标准化多语言 NER 研究。UNER v1 包含使用一致的跨语言模式在 12 种不同语言中注释的 18 个数据集。在本文中,我们详细介绍了 UNER...
Universal NER (UNER)是一个开源项目,旨在开发多语言的黄金标准NER基准,提供高质量的、跨语言一致的标注,促进和标准化多语言NER研究。UNER v1包含12种不同语言的18个数据集,使用一致的跨语言模式进行注释。文章详细介绍了UNER的数据集创建和组成,并提供了本语言和跨语言学习设置下的初始建模基线。数据、代码和拟合模型已向公众发布。