Beyond Semantics: The Unreasonable Effectiveness of Groundless Intermediate Markers

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本文研究中介标记的语义对模型表现的影响,发现模型即使在正确推理轨迹上也会生成无效轨迹,并且在使用噪声轨迹时表现良好,表明中介标记与解决方案的准确性关系不强。

🎯

关键要点

  • 本文研究中介标记的语义对模型表现的影响。
  • 研究挑战了当前对Chain of Thought(CoT)模型的解读。
  • 模型即使在正确推理轨迹上也会生成无效轨迹。
  • 在使用噪声或损坏的轨迹时,模型表现仍然良好。
  • 中介标记与解决方案准确性之间的联系相对薄弱。
  • 研究反映出对模型推理能力的误解。
➡️

继续阅读