安全语言:一个全面且互动的工具,用于分析对话中的性别歧视和辱骂性语言
📝
内容提要
本研究针对探测隐晦且依赖上下文的有毒语言(如性别歧视和辱骂行为)这一关键挑战,提出了SafeSpeech平台。该平台通过结合消息级和对话级的分析,采用精细调整的分类器和大型语言模型,实现了多维度的有毒内容检测和分析,评估结果在多个基准数据集上显示出先进的性能,特别是在细粒度性别歧视检测方面。
🏷️
标签
➡️