中文小說讀者評論資料集 / Dataset: Chinese Net Novel Rating
💡
原文中文,约2100字,阅读约需5分钟。
📝
内容提要
该文章介绍了一个中文网络小说评分数据集,包含读者对小说的评论和评分,评分为0至5星,根据星级数量分为负面、中性和正面三类。数据集共有2100个训练数据和18个未知数据,还提供了精简版的训练集。属性包括评论和评价类型,目标属性为评价类型。文章探讨了评论与评价类型的关联性,并邀请读者留言回答。该数据集为研究评论与评价类型之间的关系提供了有趣的主题,通过分析评论内容,或许可以了解读者的意见和情感反应,进一步探讨评价对小说的影响。
🎯
关键要点
- 该数据集改编自Kaggle上的中文网络小说评分数据集,适用于文本探勘练习。
- 数据集包含2118条评论数据,分为训练集和未知数据,提供原始文本和经过断词处理的文本。
- 训练集包含2100条数据,精简版训练集仅保留负面和正面评价,未知数据包含18条数据。
- 评论根据星级分为负面(0-1星)、中性(2-3星)和正面(4-5星)三类。
- 数据集属性包括评论和评价类型,目标属性为评价类型。
- 文章探讨评论字句与评价类型的关联性,邀请读者留言讨论。
- 该数据集为研究评论与评价类型之间的关系提供了有趣的主题,可能揭示读者的意见和情感反应。
- 分析评论内容有助于了解读者对小说的期望和意见,具有价值。
- 评论字句与评价类型的关联性并非绝对,需进一步研究和分析。
- 该数据集是文本探勘和情感分析等研究领域的宝贵资源。
➡️