该研究使用生成式人工智能生成合成仇恨言论序列,并微调预训练语言模型以提高对仇恨言论的泛化能力。实验证明该方法改进了召回性能,但GPT-3.5模型的泛化效果更好,召回率中等且精确度低。使用类似的文本生成技术改善GPT-3.5及后续模型的敏感性尚不清楚。
该研究使用生成式人工智能生成合成仇恨言论序列,并微调大型预训练语言模型以提高对仇恨言论的泛化能力。实验证明该方法改进了召回性能,但GPT-3.5模型的零样本仇恨检测性能仍有待提高。
完成下面两步后,将自动完成登录并继续当前操作。