The Importance of Code-Mixed Embeddings for Hate Speech Identification
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究探讨了混合语言嵌入在仇恨言论识别中的重要性,指出传统自然语言处理工具在处理混合语言数据时的局限性。研究表明,HingBERT模型在Hindi-English数据集上的表现优于BERT模型,显示出混合语言模型在多语言社区中的应用潜力。
🎯
关键要点
-
混合语言嵌入在仇恨言论识别中具有重要性。
-
传统自然语言处理工具在处理混合语言数据时存在局限性。
-
HingBERT模型在Hindi-English数据集上的表现优于BERT模型。
-
研究表明混合语言模型在多语言社区中的应用潜力巨大。
➡️