将字典融入神经网络结构从社交媒体中提取 COVID-19 医疗概念
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一组手工注释的语料库,包含10,000条推特,内容涵盖COVID-19相关事件。通过对语料库进行微调,可以自动提取公共报告的事件,并帮助追踪新病毒传播。作者将向研究界公开发布语料库、自动提取模型和知识库。
🎯
关键要点
- 本文介绍了一组手工注释的语料库,包含10,000条推特,内容涵盖COVID-19相关事件。
- 语料库包括五类事件:正反测试结果、死亡、拒绝测试、声称的治疗和预防措施。
- 该语料库支持基于BERT的分类器微调,能够自动提取公共报告的事件。
- 通过提取数百万推文中的事件,展示了对复杂问题的高准确度回答。
- 作者将向研究界公开发布语料库、自动提取模型和知识库。
➡️