审计谷歌搜索算法:衡量巴西、英国和美国的新闻多样性

💡 原文中文,约500字,阅读约需2分钟。
📝

内容提要

本文提出了一个新任务,即从多篇新闻文章中提取同一事件的多样信息。研究创建了DiverseSumm数据集,包含245个故事和10篇文章,分析了大型语言模型(LLM)在摘要中的表现,发现其覆盖率有限,GPT-4仅能覆盖不到40%的多样信息。

🎯

关键要点

  • 本文提出了一个新任务,即从多篇新闻文章中提取同一事件的多样信息。
  • 研究创建了DiverseSumm数据集,包含245个故事和10篇文章。
  • 以往研究集中于整合各个来源一致的信息,未研究多篇文章中分散的多样信息。
  • DiverseSumm数据集配有人工验证的参考摘要,用于识别多样信息。
  • 分析了大型语言模型(LLM)在摘要中的表现,发现其覆盖率有限。
  • GPT-4仅能覆盖不到40%的多样信息,显示出任务的复杂性。
➡️

继续阅读