利用新闻故事链聚类改进和评估新闻推荐中的分散性检测

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文研究了新闻推荐系统中的信息碎片化问题,通过自然语言处理技术识别不同的新闻事件、故事或时间线,并评估了不同方法在新闻故事聚类上的性能。研究发现,基于凝聚层次聚类和SentenceBERT文本表示的方法优于以往的实现。同时,模拟场景的分析为相关方提供了关于测量和解释碎片化的有益见解和建议。

🎯

关键要点

  • 新闻推荐系统在民主社会中对信息获取的重要性日益增加。
  • 推荐定制化可能导致信息流的分散,造成信息获取的碎片化。
  • 信息碎片化对公共领域的完整性构成挑战,影响民主与公共话语。
  • 通过自然语言处理技术识别不同的新闻事件、故事或时间线。
  • 评估不同方法在新闻故事聚类上的性能。
  • 基于凝聚层次聚类和SentenceBERT文本表示的方法优于以往实现。
  • 模拟场景分析为相关方提供了测量和解释碎片化的见解和建议。
➡️

继续阅读