小红花·文摘

研究发现大型语言模型在生成思维链之前已有答案，可能存在依赖缺失。提出Chain-of-Probe方法探究模型推理过程中的思维变化。结果显示Chain-of-Thought在许多问题中不必要，与任务简单性相关。分析模式发现推理过程中存在错误。提出基于CoP的策略方法，优先考虑具有正确推理的答案，增强模型推理可靠性。