本研究评估了大型语言模型在多语言攻击性语言检测中的表现,分析了GPT-3.5、Flan-T5和Mistral模型在英语、西班牙语和德语中的效果。研究首次探讨了提示语言和翻译数据对非英语任务的影响,发现模型的偏见和数据集在敏感话题的错误预测中起重要作用。
本研究针对社交媒体上的攻击性语言问题,构建了多个数据集并开发了自动分类系统,以检测仇恨言论和网络欺凌。研究表明,采用先进模型可以有效提高检测准确率,促进社交媒体平台对恶意言论的治理。
完成下面两步后,将自动完成登录并继续当前操作。