KazSAnDRA: 哈萨克评论与态度情感分析数据集

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该研究介绍了KazSAnDRA数据集,包含180,064份哈萨克评论,通过四个机器学习模型实现了情感分类自动化。最佳模型在测试集上实现了0.81的极性分类F1得分和0.39的评分分类得分。数据集和模型可通过GitHub下载。

🎯

关键要点

  • 该研究介绍了KazSAnDRA数据集,这是首个也是最大的公开可用的哈萨克情感分析数据集。
  • 数据集包含180,064份来自不同来源的评论,提供了客户态度的定量表示。
  • 研究开发和评估了四个机器学习模型,实现哈萨克情感分类的自动化。
  • 实验分析考虑了平衡和不平衡的情况。
  • 最成功的模型在测试集上实现了0.81的极性分类F1得分和0.39的评分分类得分。
  • 数据集和优化模型以CC BY 4.0许可开放获取,可通过GitHub下载。
➡️

继续阅读