小红花·文摘 - 小红花技术领袖俱乐部

本研究评估了大型语言模型在多语言攻击性语言检测中的表现，分析了GPT-3.5、Flan-T5和Mistral模型在英语、西班牙语和德语中的效果。研究首次探讨了提示语言和翻译数据对非英语任务的影响，发现模型的偏见和数据集在敏感话题的错误预测中起重要作用。

Guardians of Discourse: Evaluating the Performance of Large Language Models in Multilingual Offensive Language Detection

BriefGPT - AI 论文速递 ·

本研究针对社交媒体上的攻击性语言问题，构建了多个数据集并开发了自动分类系统，以检测仇恨言论和网络欺凌。研究表明，采用先进模型可以有效提高检测准确率，促进社交媒体平台对恶意言论的治理。

OPSD：一种冒犯性波斯社交媒体数据集及其基准评估

BriefGPT - AI 论文速递 ·