IndoToxic2024:一份丰富人口统计数据集,用于印度尼西亚语的仇恨言论和毒性类型
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本论文介绍了构建针对性仇恨言论检测系统的方法,并提出了一种整合至在线流媒体系统的实际应用。
🎯
关键要点
- 社交媒体上激进内容的快速传播增加了对仇恨言论检测的需求。
- 论文提供了一种构建针对性仇恨言论检测系统的方法。
- 介绍了一个越南社交媒体文本的针对性仇恨言论检测数据集。
- 结合预训练语言模型与基于文本表征的 Bi-GRU-LSTM-CNN 模型建立了基线模型。
- 提出了一种将检测模型整合至在线流媒体系统的方法,以防止社交媒体上的令人讨厌和冒犯性内容。
➡️