跨语言冒犯性语言检测:数据集、迁移方法和挑战的系统综述
原文中文,约400字,阅读约需1分钟。发表于: 。社交媒体中冒犯性语言的快速增长和快速演变加大了检测的复杂性,尤其突显了在不同语言中识别此类内容的挑战。该调查针对社交媒体中的冒犯性语言检测在跨语言场景中进行了系统全面的交叉语言转移学习(CLTL)技术探索。我们的研究作为首个综合概述,专注于该领域的跨语言情景。我们分析了 67 篇相关论文,并按多个维度对这些研究进行了分类,包括所使用的多语言数据集的特征,使用的跨语言资源以及具体实施的...
社交媒体中冒犯性语言的增长和演变加大了检测的复杂性。该调查研究了社交媒体中的冒犯性语言检测在跨语言场景中的技术探索。研究分析了67篇相关论文,并对研究进行了分类。研究总结了三种主要的跨语言转移方法,并讨论了当前挑战和未来研究机会。调查资源包括两个表格,提供了多语言数据集和转移方法的参考。