任务特定推理模型中的自我验证几何学
📝
内容提要
本研究探讨推理模型如何验证其答案,特别是针对CountDown任务进行模型训练。通过对Gated Linear Unit权重和“前一个token头部”的分析,发现这些因素在模型验证中起关键作用,从而提出一种新的视角,助力理解推理模型的自我验证机制。
🏷️
标签
➡️