小红花·文摘

该研究使用生成式人工智能生成合成仇恨言论序列，并微调预训练语言模型以提高对仇恨言论的泛化能力。实验证明该方法改进了召回性能，但GPT-3.5模型的泛化效果更好，召回率中等且精确度低。使用类似的文本生成技术改善GPT-3.5及后续模型的敏感性尚不清楚。

BriefGPT - AI 论文速递 ·

该研究使用生成式人工智能生成合成仇恨言论序列，并微调大型预训练语言模型以提高对仇恨言论的泛化能力。实验证明该方法改进了召回性能，但GPT-3.5模型的零样本仇恨检测性能仍有待提高。

BriefGPT - AI 论文速递 ·