GSAP-NER: 以机器学习模型和数据集为焦点的学术实体提取的新任务、语料库和基准线
原文中文,约500字,阅读约需2分钟。发表于: 。命名实体识别(NER)模型在各种自然语言处理(NLP)任务中起着关键作用,包括信息抽取(IE)和文本理解。在学术写作中,对机器学习模型和数据集的引用是各种计算机科学出版物的基本组成部分,并需要准确的模型识别。尽管 NER 取得了进展,但现有的真实数据集未将细粒度类型(如 ML 模型和模型架构)视为单独的实体类型,因此基准模型无法识别它们。本文发布了一个包含 100...
命名实体识别(NER)模型在NLP任务中起关键作用。本文发布了一个包含100个手动注释的科学出版物语料库,并提供了一个围绕ML模型和数据集的基准模型。数据集还包含了与非正式提及相关的注释。