小红花·文摘

本研究分析了思维标记（TT）在语言模型推理中的不足，发现其相较于连锁推理（CoT）仅有边际改善且一致性较差。研究表明，TT依赖单一嵌入导致学习信号不一致，影响未来无监督推理的研究。