小红花·文摘

本研究分析了优化推理的语言模型o1，探讨其自回归不足的问题。结果显示，o1在处理稀有变体任务时有所提升，但仍对例子和任务概率敏感，表明优化未能完全解决这一问题。