BriefGPT - AI 论文速递 ·

对抗风格扩充的大型语言模型用于鲁棒假新闻检测

💡 原文中文，约2000字，阅读约需5分钟。

📝

内容提要

本文研究了大型语言模型在假新闻检测中的应用，发现现有检测器对机器生成内容存在偏见。提出了Style-News框架，通过分析出版商元数据提高检测准确性，并发布了新数据集以推动研究。同时，设计了自适应启示指导网络（ARG）以改善检测效果，强调了结合小型和大型语言模型的优势。

🎯

❓

现有假新闻检测器对机器生成内容存在偏见，容易将其标记为假新闻，而常常误将人类撰写的假新闻分类为真实。

Style-News框架通过分析出版商元数据，提高假新闻检测的准确性，防止有害虚假信息传播。

新数据集“GossipCop++”与“PolitiFact++”结合了人工验证的文章与机器生成的假新闻，推动了假新闻检测的研究。

ARG结合小型和大型语言模型的优势，通过选择性获取大型模型的解释，显著提高了假新闻检测的准确性。

ARG和ARG-D在真实数据集上的表现优于现有的检测方法，显示出更高的检测准确性。

通过对抗训练与大型语言模型重写真实新闻相结合的策略，显著提高了人类和机器生成新闻的检测准确性。

🏷️