社会语言学驱动的可解释性:一项关于印汉混合语情感分类的案例研究

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了SemEval-2020任务9关于混合代码推文情感分析(SentiMix 2020)的结果,包括Hinglish和Spanglish语料库的标记和描述。最佳表现分别为75.0%和80.6%的F1得分。观察到BERT-like模型和集合方法是最常见和成功的方法。

🎯

关键要点

  • 本文介绍了SemEval-2020任务9的混合代码推文情感分析结果。
  • 发布了Hinglish和Spanglish语料库,包含单词级别语言识别和句子级别情感标签。
  • Hinglish和Spanglish的最佳F1得分分别为75.0%和80.6%。
  • BERT-like模型和集合方法是比赛中最常见和成功的方法。
➡️

继续阅读