实时伪新闻生成与对抗性反馈
发表于: 。本研究解决了现有伪新闻检测评估存在的不足,指出传统基于事实核查网站的评估方法无法有效应对新兴伪新闻。通过开发一种新颖的管道,利用基于检索的检测器的自然语言反馈,迭代生成具有挑战性的伪新闻,研究发现这一方法显著提高了对抗性攻击的检测效率,减少了强大检测器的分类准确率。
本研究解决了现有伪新闻检测评估存在的不足,指出传统基于事实核查网站的评估方法无法有效应对新兴伪新闻。通过开发一种新颖的管道,利用基于检索的检测器的自然语言反馈,迭代生成具有挑战性的伪新闻,研究发现这一方法显著提高了对抗性攻击的检测效率,减少了强大检测器的分类准确率。