BriefGPT - AI 论文速递 ·

GSAP-NER: 以机器学习模型和数据集为焦点的学术实体提取的新任务、语料库和基准线

💡 原文中文，约500字，阅读约需2分钟。

📝

内容提要

命名实体识别（NER）模型在NLP任务中起关键作用。本文发布了一个包含100个手动注释的科学出版物语料库，并提供了一个围绕ML模型和数据集的基准模型。数据集还包含了与非正式提及相关的注释。

🎯

关键要点

命名实体识别（NER）模型在自然语言处理（NLP）任务中起关键作用。
NER在信息抽取（IE）和文本理解等任务中应用广泛。
学术写作中对机器学习模型和数据集的引用需要准确识别。
现有数据集未将细粒度类型（如ML模型和模型架构）视为单独实体类型。
本文发布了一个包含100个手动注释的科学出版物语料库。
提供了一个围绕ML模型和数据集的10种实体类型的基准模型。
数据集还包含与非正式提及相关的注释，例如“我们的BERT模型”或“图像CNN”。
真实的数据集和代码可在指定URL找到，以便复制模型训练。

🏷️

继续阅读

OpenAI官方证实内部测试模型越狱并自主挖掘漏洞入侵开源平台HuggingFace
#安全资讯 OpenAI 官方证实内部测试模型越狱并自主挖掘漏洞入侵开源平台 Hugging Face，这起黑客攻击事件源头竟然是 OpenAI 测试模型...
法院批准A社与作者和出版社的15亿美元和解协议初步解决A社使用盗版图书训练模型问题
#人工智能法院批准 A 社与作者和出版社的 15 亿美元和解协议，初步解决 A 社使用盗版书籍训练模型的集体诉讼案件。法庭文件显示，A 社建立拥有 70...
有传言称谷歌正在研发名为Frozen v2的芯片将AI模型部分蚀刻到芯片上提高吞吐量
#人工智能谷歌也尝试将模型权重直接蚀刻到硅晶片中，谷歌正在研发的 Frozen v2 芯片 token 吞吐量是谷歌现有 TPU 单元的 6~10 倍。...
从 Token 价格战到成功任务单位经济学：AI 成本战的真正主线（上） - 张善友
AI 行业过去最喜欢讲的是"能力"，今天越来越必须讲的是"结果"。"有用智能每人民币"（Useful In...
GPT兄弟结伙越狱黑掉Hugging Face：开源模型临危受命成功救场
GPT-5.6 Sol联合另外一个神秘模型为了作弊直接黑进了Hugging Face的生产数据库，这你受得了吗？ OpenAI自家模型在安全测试中失控，利...
关键时刻还是靠开源模型：HuggingFace遭黑客攻击某模型拒绝审计最后靠GLM-5.2
#人工智能关键时刻还是得靠开源模型：HuggingFace 遭到黑客攻击，想要使用 Claude 进行取证分析时始终被拒绝，最终只能本地部署开源的 GL...

内容提要

关键要点

标签

继续阅读