审计谷歌搜索算法:衡量巴西、英国和美国的新闻多样性
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
本文提出了一个新任务,即从多篇新闻文章中提取同一事件的多样信息。研究创建了DiverseSumm数据集,包含245个故事和10篇文章,分析了大型语言模型(LLM)在摘要中的表现,发现其覆盖率有限,GPT-4仅能覆盖不到40%的多样信息。
🎯
关键要点
- 本文提出了一个新任务,即从多篇新闻文章中提取同一事件的多样信息。
- 研究创建了DiverseSumm数据集,包含245个故事和10篇文章。
- 以往研究集中于整合各个来源一致的信息,未研究多篇文章中分散的多样信息。
- DiverseSumm数据集配有人工验证的参考摘要,用于识别多样信息。
- 分析了大型语言模型(LLM)在摘要中的表现,发现其覆盖率有限。
- GPT-4仅能覆盖不到40%的多样信息,显示出任务的复杂性。
➡️