探索 LLM 生成的虚假新闻的欺骗力：对现实世界检测挑战的研究

最近大规模语言模型（LLMs）的进展使得虚假新闻的制造成为可能，本研究旨在确定提示技术是否能够有效缩小 LLM 生成的虚假新闻的欺骗性差距，通过提出一种名为条件变分自编码类提示（VLPrompt）的强大虚假新闻攻击方法，该方法无需额外的数据采集，并且保持了上下文的一致性和原始文本的细节。为了推动 VLPrompt 攻击的检测研究，我们创建了一个新的数据集名为 VLPrompt 虚假新闻（VLPFN），其中包含真实文本和假文本。我们进行了各种检测方法和新颖的人类研究指标的实验，来评估它们在我们的数据集上的性能，得出了众多发现。

研究人员提出了一种名为VLPrompt的虚假新闻攻击方法，可以缩小大规模语言模型生成的虚假新闻的欺骗性差距。他们还创建了一个新的数据集来推动该攻击的检测研究。通过实验评估各种检测方法和人类研究指标在该数据集上的性能，得出了一些发现。