KazSAnDRA: 哈萨克评论与态度情感分析数据集
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该研究介绍了KazSAnDRA数据集,包含180,064份哈萨克评论,通过四个机器学习模型实现了情感分类自动化。最佳模型在测试集上实现了0.81的极性分类F1得分和0.39的评分分类得分。数据集和模型可通过GitHub下载。
🎯
关键要点
- 该研究介绍了KazSAnDRA数据集,这是首个也是最大的公开可用的哈萨克情感分析数据集。
- 数据集包含180,064份来自不同来源的评论,提供了客户态度的定量表示。
- 研究开发和评估了四个机器学习模型,实现哈萨克情感分类的自动化。
- 实验分析考虑了平衡和不平衡的情况。
- 最成功的模型在测试集上实现了0.81的极性分类F1得分和0.39的评分分类得分。
- 数据集和优化模型以CC BY 4.0许可开放获取,可通过GitHub下载。
➡️