The Importance of Code-Mixed Embeddings for Hate Speech Identification

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究探讨了混合语言嵌入在仇恨言论识别中的重要性,指出传统自然语言处理工具在处理混合语言数据时的局限性。研究表明,HingBERT模型在Hindi-English数据集上的表现优于BERT模型,显示出混合语言模型在多语言社区中的应用潜力。

🎯

关键要点

  • 混合语言嵌入在仇恨言论识别中具有重要性。

  • 传统自然语言处理工具在处理混合语言数据时存在局限性。

  • HingBERT模型在Hindi-English数据集上的表现优于BERT模型。

  • 研究表明混合语言模型在多语言社区中的应用潜力巨大。

➡️

继续阅读