使用深度学习对阿姆哈拉语文本进行仇恨言论检测和分类

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

埃塞俄比亚社交媒体上的仇恨言论是严重问题。研究人员开发了深度学习模型,可以检测和分类不同类型的仇恨言论,使用阿姆哈拉语数据集,获得94.8的F1得分。未来工作将包括扩大数据集和改进模型。

🎯

关键要点

  • 埃塞俄比亚社交媒体上的仇恨言论问题日益严重,可能引发种族和宗教冲突。
  • 研究人员开发了阿姆哈拉语仇恨言论数据集和 SBi-LSTM 深度学习模型。
  • 模型能够将文本分类为四种仇恨言论类别:种族、宗教、性别和非仇恨言论。
  • 使用自定义注释工具对 5,000 条社交媒体帖文和评论进行了注释,参与者为 100 名阿姆哈拉语母语者。
  • 模型在检测和分类方面表现出 94.8 的 F1 得分。
  • 未来的工作将包括扩大数据集和开发更先进的模型。
➡️

继续阅读