美国故事:历史美国报纸的大规模结构化文本数据集

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

通过众包发布了一个包含5000个英文新闻标题的数据集,用于情感分类、情感强度预测、情感原因检验和定性研究。开发了语义角色结构自动预测任务的基线,并讨论了结果。

🎯

关键要点

  • 通过众包发布了一个包含5000个英文新闻标题的数据集。
  • 数据集包括情感、情感体验者、文本线索、相关情感原因和目标。
  • 读者对标题情感的感知也被纳入数据集。
  • 提出了一个多阶段的注释程序。
  • 开发了语义角色结构自动预测任务的基线。
  • 讨论了结果,数据集支持情感分类、情感强度预测、情感原因检验和定性研究。
➡️

继续阅读