The Verge ·

OpenAI预告了新的推理模型——但别指望很快就能试用

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

OpenAI预告了新的推理模型o3和o3-mini，尚未公开发布。o3在编码测试中表现优异，超越了前代模型，并在数学和科学问题上取得高分。同时，公司研究了逐步安全决策的对齐方法，以提升模型遵循安全指南的能力。

🎯

🔎

OpenAI的新推理模型o3在多个测试中表现出色，尤其是在编码和数学问题上，超越了前代模型。这表明，o3在处理复杂任务时的能力显著提升，可能会对开发者和研究人员在实际应用中带来更高的效率和准确性。

OpenAI正在探索逐步安全决策的对齐方法，这种方法要求模型在做出决策时逐步分析用户请求是否符合安全政策。这一研究进展可能会提高AI模型在实际应用中的安全性，减少潜在的风险。

尽管o3和o3-mini的性能令人期待，但OpenAI尚未确定公开发布的时间。这意味着用户和开发者需要耐心等待，同时也要关注后续的测试结果和应用机会。

❓

o3和o3-mini是OpenAI预告的新推理模型，o3在编码测试中表现优异，超越了前代模型，并在数学和科学问题上取得高分。

o3在编码测试中超越了前代模型，成绩提高了22.8%。

o3在数学竞赛中几乎满分，仅错过一题，并在专家级科学问题基准测试中取得87.7%的高分。

OpenAI研究了逐步安全决策的对齐方法，使模型能够逐步处理安全决策，而不是简单的是/否规则。

o3在最难的数学和推理挑战中解决了25.2%的问题，而其他模型的解决率不超过2%。

OpenAI跳过o2是为了避免与英国电信公司O2的商标冲突。

🏷️