SpeakGer: A Metadata-Enriched Speech Corpus of German States and Federal Parliament

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究推出了SpeakGer数据集,涵盖1947年至2023年德国16个联邦州及联邦议会的辩论,共包含10,806,105个演讲。该数据集支持定量分析,并进行了多党派主题变化和COVID-19疫情相关情感分析。

🎯

关键要点

  • 本研究推出了SpeakGer数据集,涵盖1947年至2023年德国16个联邦州及联邦议会的辩论。
  • SpeakGer数据集共包含10,806,105个演讲,旨在解决政治文本和演讲中的元信息缺失问题。
  • 该数据集通过丰富的元数据支持更细致的定量分析。
  • 研究进行了多党派主题变化和COVID-19疫情相关情感分析等三项探索性分析。
➡️

继续阅读