小红花·文摘

本研究探讨大型语言模型（LLMs）在检测冒犯性语言时的人类注释分歧问题。研究发现，LLMs对注释分歧样本的信心与人类一致性相关，这些分歧影响模型决策，为改进冒犯性语言检测提供了指导。

BriefGPT - AI 论文速递 ·

DEV Community ·

本文探讨了社交媒体中检测和分类性别歧视及冒犯性语言的方法，采用多种预训练模型和数据增强技术。研究表明，半监督学习能显著提高模型性能，尤其在资源匮乏的语言环境中，强调跨文化学习对改善攻击性语言检测的重要性。

BriefGPT - AI 论文速递 ·

本文介绍了韩国冒犯性语言数据集（KOLD），包含40,429个注释评论，适用于韩文BERT和RoBERTa模型的训练。研究表明，提供上下文信息显著提升了模型在冒犯性检测和目标分类任务中的性能。

BriefGPT - AI 论文速递 ·

社交媒体中冒犯性语言的增长和演变加大了检测的复杂性。该调查研究了社交媒体中的冒犯性语言检测在跨语言场景中的技术探索。研究分析了67篇相关论文，并对研究进行了分类。研究总结了三种主要的跨语言转移方法，并讨论了当前挑战和未来研究机会。调查资源包括两个表格，提供了多语言数据集和转移方法的参考。

BriefGPT - AI 论文速递 ·

本研究介绍了韩文中最大的冒犯性语言语料库K-HATERS，包含192K个新闻评论，可检测不同程度的仇恨表达。研究者采用认知反思测试作为标签质量的代理，解决了人类注释中的潜在噪声和偏差。该研究对仇恨言论检测和自然语言处理资源构建具有重要贡献。

BriefGPT - AI 论文速递 ·