量子位 ·

上海AI实验室版o1已上线！数学题、Leetcode全拿下，还会玩24点

💡 原文中文，约2400字，阅读约需6分钟。

📝

内容提要

上海AI实验室推出的强推理模型书生InternThinker已上线，能够快速解决复杂的数学、编程和数字游戏任务，具备长时间思考和自我反思的能力，推理表现优异，提升了整体推理能力。

🎯

🔎

InternThinker具备自我反思和纠正的能力，这使得它在解决复杂问题时能够动态调整思路。这种能力不仅提升了模型的推理准确性，也为用户提供了更可靠的解题过程，尤其在数学和编程任务中表现突出。

该模型采用元认知理论来提升推理能力，模拟人类的学习过程。这种方法使得InternThinker在面对复杂任务时，能够更灵活地选择思维策略，从而提高了解题效率和准确性，值得关注其在教育和科研领域的潜在应用。

InternThinker的训练依赖于大规模沙盒环境，这为模型提供了丰富的反馈信号。通过这种方式，模型能够在多种推理任务中不断优化自身表现，未来可能在实际应用中展现出更强的适应性和实用性。

❓

书生InternThinker模型能够快速解决复杂的数学、编程和数字游戏任务，具备长思维能力和自我反思能力。

InternThinker通过元认知理论学习思维模式、通专融合的高密度监督数据路径和构建大规模沙盒环境来提升推理能力。

InternThinker在编程方面表现优异，能够分步写出解决思路并检查整体逻辑和边界条件，成功通过Leetcode赛题。

InternThinker在处理复杂数学问题时，会列出相关知识点并逐步进行推理计算，接近人类解题方式。

上海AI实验室计划将相关技术融入下一代书生大模型，并继续推动技术进步。

InternThinker在推理过程中能够检查冲突并进行自我反思和纠正，从而提升推理能力。

🏷️