2021年东京奥运会多语言新闻文章数据集

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本研究解决了多语言新闻聚类算法评估中的数据集不足问题,推出了涵盖2021年东京奥运会的多语言新闻数据集,包含来自1918个出版商的10,940篇文章。

🎯

关键要点

  • 本研究解决了多语言新闻聚类算法评估中的数据集不足问题。
  • 推出了涵盖2021年东京奥运会的多语言新闻数据集。
  • 该数据集包含来自1918个出版商的10,940篇文章。
  • 数据集涉及1350个子事件。
  • 提供了多语言视角下的奥运会动态分析的可能性。
➡️

继续阅读