量子位 ·

大模型越反思越错，原来是长链推理通过自我说服加重幻觉 | 北邮

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

研究发现，长链推理中的反思并非纠错，而是加重幻觉。北京邮电大学的团队指出，推理链越长，错误越容易固化，尤其在高风险领域。目前的检测方法效果不佳，难以有效识别和修正幻觉。

🎯

🔎

长链推理在高风险领域（如医疗、金融、法律）中尤为危险。即使是微小的错误也可能导致严重后果。研究表明，错误在推理链中会像滚雪球一样放大，导致最终结果的可靠性大幅下降。

模型在长链推理中进行反思时，往往不是纠正错误，而是通过自我说服加固错误。这种现象使得模型在面对复杂问题时，反而更容易产生幻觉，影响决策的准确性。

当前的幻觉检测方法在长链推理中表现不佳，准确率不足79%。这表明，现有技术无法有效识别和修正推理过程中的错误，尤其是在元认知漂移的情况下，亟需改进检测手段。

❓

长链推理中的反思并不是纠错，而是加重幻觉，导致错误固化。

在医疗、金融、法律等高风险领域，细小偏差可能导致灾难。

现有检测方法准确率不足79%，难以有效识别和修正幻觉。

研究团队基于RFC协议文档构建受控知识域，确保问题的封闭性和可验证性。

模型在长链推理中生成假设性主张并虚构依据，导致知识造假和元认知漂移。

正向干预实验包括精准定位错误节点、三阶段干预和六维评估指标。

🏷️