本研究分析了思维标记(TT)在语言模型推理中的不足,发现其相较于连锁推理(CoT)仅有边际改善且一致性较差。研究表明,TT依赖单一嵌入导致学习信号不一致,影响未来无监督推理的研究。
完成下面两步后,将自动完成登录并继续当前操作。