量子位 ·

o3来了！编程能力跻身人类全球前200，破解陶哲轩说难的数学测试，北大校友任泓宇现身直播间

💡 原文中文，约1700字，阅读约需4分钟。

📝

内容提要

OpenAI发布了新模型o3，编程能力跻身全球前200，数学测试成绩显著提升。o3-mini成功生成并执行Python脚本。北大校友任泓宇在直播中介绍了模型的进展与应用。

🎯

🔎

OpenAI的新模型o3在编程和数学测试中取得显著进展，尤其是在ARC-AGI和EpochAI Frontier Math测试中，分数大幅提升。这表明o3在处理复杂逻辑和数学问题上的能力有了质的飞跃，未来可能在教育、科研等领域广泛应用，帮助人类解决更复杂的任务。

o3-mini的发布展示了其生成和执行Python脚本的能力，尤其在低思考程度下表现出色。这一功能不仅提升了编程效率，也为开发者提供了新的工具，可能改变软件开发的方式。值得关注的是，o3-mini目前处于早期预览阶段，实际应用仍需进一步验证。

北大校友任泓宇在直播中介绍o3的进展，他作为GPT-4o的核心开发者，参与了多个重要项目的研发。他的背景和经验为o3的开发提供了强有力的支持，未来他在OpenAI的工作可能会对AI技术的发展产生深远影响，值得持续关注。

❓

o3模型的编程能力跻身全球前200，能够生成并执行Python脚本。

o3在ARC-AGI测试中的分数从32%提升至75.7%和87.5%，在EpochAI Frontier Math测试中得分从2分提升至25分。

任泓宇在直播中展示了o3-mini的编程能力，成功生成并执行了Python脚本。

o3有低思考程度和高思考程度两种设置，而o3-mini支持低中高三种思考程度设置。

o3-mini主要用于生成代码并执行，适用于编程任务和API调用。

o3和o3-mini目前处于早期预览状态，仅供安全研究者申请访问。

🏷️