WebNovelBench:将大型语言模型小说家置于网络小说分发上的平台
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究探讨大型语言模型在长篇故事创作中的评估挑战,提出WebNovelBench基准,利用4000多个中文网络小说数据集,从多个角度评估叙事质量,以区分人类作品与LLM生成内容。
🎯
关键要点
- 本研究聚焦于大型语言模型在长篇故事创作中的评估挑战。
- 现有基准缺乏规模、多样性和客观性。
- 提出了WebNovelBench,一个新颖的基准。
- WebNovelBench利用4000多个中文网络小说的数据集。
- 评估从多个角度进行,关注叙事质量。
- 旨在有效区分人类作品与LLM生成的内容。
🏷️
标签
➡️