少数派 ·

派早报：OpenAI 发布 GPT-5.1-Codex-Max 模型等

💡 原文中文，约600字，阅读约需2分钟。

📝

内容提要

OpenAI 于 11 月 19 日发布了 GPT-5.1-Codex-Max 编程模型，提升了长程推理和实时交互能力，软件问题解决测试准确率达到 77.9%。该模型引入了智能保留关键内容的机制，提升了 token 利用率约 30%。

🎯

关键要点

OpenAI 于 11 月 19 日发布了 GPT-5.1-Codex-Max 编程模型。
该模型在长程推理、效率与实时交互方面取得明显提升。
GPT-5.1-Codex-Max 在 SWE-Bench Verified 测试中准确率达到 77.9%。
在 Terminal-Bench 2.0 中准确率为 58.1%。
在 LiveCodeBench Pro 上获得 2439 分。
模型引入了名为 Compaction 的机制，智能保留关键内容，丢弃次要细节。
该机制使模型能够连续处理数百万 token 而不出现性能下降。
模型已成功完成超过 24 小时的复杂任务，如多步骤代码重构与自主调试。
技术使 token 利用率提升约 30%，降低了成本与延迟。
GPT-5.1-Codex-Max 已整合进 OpenAI 多个自研的 Codex 开发环境。

🏷️

继续阅读

具身智能资源汇总：机器人学习数据集，在线体验世界建模模型，英伟达/字节/小米等最新研究论文
本文系统整理了一批具身智能相关的高质量数据集、在线教程、论文，为进一步学习和研究提供参考，欢迎前往 hyper.ai 探索更多优质资源！
微软发布 VibeVoice-ASR：一种统一的语音转文本模型，旨在一次性处理长达 60 分钟的音频
微软推出了VibeVoice-ASR，一个开源的语音转文本模型，支持最长60分钟的音频处理，输出结构化文本，包括“谁”、“何时”、“什么”。该模型允许用户...
派早报：realme 真我发布新品、Xbox 应用登陆 Arm PC 等
1月22日，realme发布了真我Neo8手机和Buds Air8耳机。Neo8搭载第五代骁龙8 SoC，配备165Hz屏幕和8000mAh电池，支持PC...
马基参议员质疑OpenAI在ChatGPT中的‘欺骗性广告’
马基参议员对OpenAI在ChatGPT中引入广告表示担忧，认为这可能影响消费者保护和隐私。他向多家公司询问类似计划，并指出广告可能利用用户与聊天机器人的...
AI辅助开发的主厨模型
随着AI编码助手的发展，开发者的角色正在转变为管理AI，专注于设计和质量控制。开发者需要掌握反馈循环、任务委派和模块化设计等新技能，以提高效率。同时，AI...
Codex现已集成至JetBrains IDE
OpenAI Codex已与JetBrains IDE原生集成，用户可直接在IDE中使用，支持多种认证方式，包括JetBrains AI订阅和ChatGP...

派早报：OpenAI 发布 GPT-5.1-Codex-Max 模型等

内容提要

关键要点

标签

继续阅读