抑郁情绪多标签分类的新颖数据集

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

这篇文章介绍了一个包含超过42k个泰米尔YouTube评论的情绪识别标注数据集。作者创建了三种情感分组并评估了模型性能。MURIL-base模型在3类组数据集上达到了0.6的宏平均F1分数。在7类和31类组中,随机森林模型的宏平均F1分数分别为0.42和0.29。

🎯

关键要点

  • 文章介绍了一个包含超过42k个泰米尔YouTube评论的情绪识别标注数据集。
  • 该数据集标注了31种情绪,包括中立情绪,旨在改善泰米尔语中的情绪检测。
  • 作者创建了三种情感分组:3类、7类和31类,并评估了模型性能。
  • MURIL-base模型在3类组数据集上达到了0.6的宏平均F1分数。
  • 在7类和31类组中,随机森林模型的宏平均F1分数分别为0.42和0.29。
➡️

继续阅读