代码混合情感和仇恨言论预测
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了为SemEval-2020 Task 9开发的两个系统,用于处理印地语-英语和西班牙语-英语混合语言。他们使用多种神经网络方法和预训练的单词嵌入,提出的多语言BERT方法在印地语-英语任务中表现出色,平均F1得分为0.6850。对于西班牙语-英语任务,他们使用了基于Transformer的多语言模型XLM-RoBERTa,获得了平均F1得分为0.7064,排名第17位。
🎯
关键要点
- 本文介绍了为SemEval-2020 Task 9开发的两个系统,处理印地语-英语和西班牙语-英语混合语言。
- 研究团队使用多种神经网络方法和预训练的单词嵌入。
- 提出的多语言BERT方法在印地语-英语任务中表现出色,平均F1得分为0.6850。
- 对于西班牙语-英语任务,使用基于Transformer的多语言模型XLM-RoBERTa,平均F1得分为0.7064。
- 在西班牙语-英语任务中,团队排名第17位,共有29个参赛者。
➡️