小红花·文摘

该研究提出了一种审计方法，用于检测大型语言模型中是否编码了幻觉等模式，并可向下游任务传播。研究结果表明，BERT在编码幻觉方面能力有限，而OPT能够在内部编码幻觉信息。该方法在没有暴露于虚假陈述的情况下，表现出与完全监督的离群样本分类器相当的性能。

BriefGPT - AI 论文速递 ·

该研究提出了一种审计方法，用于检测大型语言模型中的异常模式，并能传播到下游任务。研究结果表明，BERT在编码幻觉方面能力有限，而OPT则能够编码幻觉信息。该方法在没有暴露于虚假陈述的情况下，表现出与完全监督的离群样本分类器相当的性能。

BriefGPT - AI 论文速递 ·