OpenNER 1.0:标准化的50多种语言开放获取命名实体识别数据集
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本研究推出OpenNER 1.0,这是一个标准化的开放获取命名实体识别数据集,涵盖51种语言的34个数据集,旨在推动多语言NER研究并提供基线模型。
🎯
关键要点
- 本研究推出OpenNER 1.0,这是一个标准化的开放获取命名实体识别数据集。
- OpenNER涵盖51种语言的34个数据集。
- 该工作对数据集进行了格式修正和标准化。
- 提供了一致的实体类型名称映射,以促进多语言和多本体的NER研究。
- 提供基线模型以比较不同模型的性能,推动未来的NER研究。
➡️