派早报:OpenAI 发布 GPT-5.1-Codex-Max 模型等

💡 原文中文,约600字,阅读约需2分钟。
📝

内容提要

OpenAI 于 11 月 19 日发布了 GPT-5.1-Codex-Max 编程模型,提升了长程推理和实时交互能力,软件问题解决测试准确率达到 77.9%。该模型引入了智能保留关键内容的机制,提升了 token 利用率约 30%。

🎯

关键要点

  • OpenAI 于 11 月 19 日发布了 GPT-5.1-Codex-Max 编程模型。
  • 该模型在长程推理、效率与实时交互方面取得明显提升。
  • GPT-5.1-Codex-Max 在 SWE-Bench Verified 测试中准确率达到 77.9%。
  • 在 Terminal-Bench 2.0 中准确率为 58.1%。
  • 在 LiveCodeBench Pro 上获得 2439 分。
  • 模型引入了名为 Compaction 的机制,智能保留关键内容,丢弃次要细节。
  • 该机制使模型能够连续处理数百万 token 而不出现性能下降。
  • 模型已成功完成超过 24 小时的复杂任务,如多步骤代码重构与自主调试。
  • 技术使 token 利用率提升约 30%,降低了成本与延迟。
  • GPT-5.1-Codex-Max 已整合进 OpenAI 多个自研的 Codex 开发环境。
➡️

继续阅读