构建 CORD-19 疫苗数据集

📝

内容提要

引入了新的数据集 'CORD-19-Vaccination',为专注于 COVID-19 疫苗相关研究的科学家提供支持。该数据集从 CORD-19 数据集中提取而来,并增加了每篇论文的语言细节、作者人口统计学、关键词和主题等新列。利用 Facebook 的 fastText 模型识别语言并使用 Google 的搜索 API 确定作者人口统计学。使用 'Yake'...

🏷️

标签

➡️

继续阅读