IndoToxic2024:一份丰富人口统计数据集,用于印度尼西亚语的仇恨言论和毒性类型

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本论文介绍了构建针对性仇恨言论检测系统的方法,并提出了一种整合至在线流媒体系统的实际应用。

🎯

关键要点

  • 社交媒体上激进内容的快速传播增加了对仇恨言论检测的需求。
  • 论文提供了一种构建针对性仇恨言论检测系统的方法。
  • 介绍了一个越南社交媒体文本的针对性仇恨言论检测数据集。
  • 结合预训练语言模型与基于文本表征的 Bi-GRU-LSTM-CNN 模型建立了基线模型。
  • 提出了一种将检测模型整合至在线流媒体系统的方法,以防止社交媒体上的令人讨厌和冒犯性内容。
➡️

继续阅读