WebNovelBench:将大型语言模型小说家置于网络小说分发上的平台

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本研究探讨大型语言模型在长篇故事创作中的评估挑战,提出WebNovelBench基准,利用4000多个中文网络小说数据集,从多个角度评估叙事质量,以区分人类作品与LLM生成内容。

🎯

关键要点

  • 本研究聚焦于大型语言模型在长篇故事创作中的评估挑战。
  • 现有基准缺乏规模、多样性和客观性。
  • 提出了WebNovelBench,一个新颖的基准。
  • WebNovelBench利用4000多个中文网络小说的数据集。
  • 评估从多个角度进行,关注叙事质量。
  • 旨在有效区分人类作品与LLM生成的内容。
➡️

继续阅读