POLygraph:波兰假新闻数据集

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

该论文介绍了POLygraph数据集,该数据集是一个在波兰进行假新闻检测的资源。数据集包含真假新闻文章及标签以及真假评论。该项目还开发了一款使用机器学习技术分析数据真实性的软件工具。该工具和数据集将惠及公共部门机构、出版商和事实核查组织等实体。进一步研究将促进假新闻检测,并在其他语言中推动类似模型的实施。

🎯

关键要点

  • 该论文介绍了POLygraph数据集,这是一个在波兰进行假新闻检测的独特资源。
  • 数据集包含两个部分:11,360对新闻文章及相应标签的真假数据集,以及5,082篇新闻文章及相关推文的真假评论数据集。
  • POLygraph数据集涵盖了源自文献的多种方法,为假新闻检测提供了全面的资源。
  • 数据是通过专家和非专家标注人员的手动注释收集的。
  • 该项目开发了一款使用先进机器学习技术分析数据并确定内容真实性的软件工具。
  • 该工具和数据集预计将惠及公共部门机构、出版商和事实核查组织等各种实体。
  • 进一步对数据集的研究将促进假新闻检测,并可能在其他语言中推动类似模型的实施。
  • 论文侧重于数据集的创建和组成,不包括对内容真实性分析软件工具的详细评估。
➡️

继续阅读