美国故事:历史美国报纸的大规模结构化文本数据集
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
通过众包发布了一个包含5000个英文新闻标题的数据集,用于情感分类、情感强度预测、情感原因检验和定性研究。开发了语义角色结构自动预测任务的基线,并讨论了结果。
🎯
关键要点
- 通过众包发布了一个包含5000个英文新闻标题的数据集。
- 数据集包括情感、情感体验者、文本线索、相关情感原因和目标。
- 读者对标题情感的感知也被纳入数据集。
- 提出了一个多阶段的注释程序。
- 开发了语义角色结构自动预测任务的基线。
- 讨论了结果,数据集支持情感分类、情感强度预测、情感原因检验和定性研究。
➡️