使用大型语言模型进行网络欺凌检测
💡
原文中文,约600字,阅读约需2分钟。
📝
内容提要
社交媒体平台在内容审查上的困难导致用户滥用平台传播低俗或侮辱性言论,造成网络霸凌。本文调研了相关研究,提出改进网络霸凌检测的建议,并发布了一个基于方言的数据集和机器学习解决方案。
🎯
关键要点
- 社交媒体平台在内容审查上存在困难,导致用户传播低俗或侮辱性言论。
- 网络霸凌是一种在虚拟环境中发生的社会问题,可能导致现实中的严重后果,如抑郁和自杀倾向。
- 现有的自动检测网络霸凌的系统大多只适用于英文,资源匮乏语言的支持非常有限。
- 本文调研了2017年至2023年间关于资源匮乏语言和方言中自动检测网络霸凌的研究,分析了70篇相关文献。
- 调研涵盖了23种资源匮乏语言和方言,包括孟加拉语、印地语和德拉维达语。
- 发现了以往研究中的空白,包括对网络霸凌的定义缺乏和数据获取中的偏见。
- 基于研究空白,提出了改进网络霸凌检测的建议,重点关注资源匮乏语言。
- 收集并发布了一个基于Chittagonian方言的网络霸凌数据集,并提出了初步的机器学习解决方案。
- 尝试了基于预训练的BanglaBERT模型进行网络霸凌检测。
➡️