抑郁情绪多标签分类的新颖数据集
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
这篇文章介绍了一个包含超过42k个泰米尔YouTube评论的情绪识别标注数据集。作者创建了三种情感分组并评估了模型性能。MURIL-base模型在3类组数据集上达到了0.6的宏平均F1分数。在7类和31类组中,随机森林模型的宏平均F1分数分别为0.42和0.29。
🎯
关键要点
- 文章介绍了一个包含超过42k个泰米尔YouTube评论的情绪识别标注数据集。
- 该数据集标注了31种情绪,包括中立情绪,旨在改善泰米尔语中的情绪检测。
- 作者创建了三种情感分组:3类、7类和31类,并评估了模型性能。
- MURIL-base模型在3类组数据集上达到了0.6的宏平均F1分数。
- 在7类和31类组中,随机森林模型的宏平均F1分数分别为0.42和0.29。
➡️