量子位 ·

GPT-5.4发布：OpenAI首个大一统模型，简直是龙虾原生

💡 原文中文，约4500字，阅读约需11分钟。

📝

内容提要

OpenAI发布的GPT-5.4是首个大一统模型，集成推理、编程和计算机操作能力，性能提升且成本降低。其计算和编程功能显著增强，适用于复杂任务，并在多个基准测试中表现优异，成为AI数字员工的代表。尽管定价略高，但通过技术优化降低了任务成本。

🎯

🔎

GPT-5.4被定位为AI数字员工，具备独立处理复杂任务的能力。这一转变意味着企业可以更依赖AI来完成日常工作，降低人力成本，同时提高工作效率。随着AI在办公领域的应用日益广泛，企业需关注如何有效整合这些技术以提升生产力。

GPT-5.4引入的工具搜索机制显著降低了Token使用率，达到47%的节省。这一创新不仅提升了模型的响应速度，也为企业在使用AI时提供了更具成本效益的解决方案。企业在选择AI工具时，应考虑这些技术优化带来的潜在经济效益。

GPT-5.4在高阶编程与调试方面的能力提升，可能会改变软件开发的工作流程。其视觉化调试功能使得AI能够更接近人类工程师的工作方式，这可能会对中间件和传统开发岗位造成冲击。开发者需关注这一趋势，以适应未来的工作环境。

❓

GPT-5.4在推理过程中使用的Token数量显著减少，响应速度更快，整体成本更低，同时在多个基准测试中表现优异。

GPT-5.4可以通过截图理解软件界面，并执行鼠标点击和键盘输入等操作，完成如发送邮件、创建日历事件等任务。

在GDPval基准测试中，GPT-5.4的得分达到83.0%，与专业从业者持平，能够完成真实工作产物。

GPT-5.4支持更快的Token输出速度和视觉化调试功能，能够在生成网页或应用时进行实时调试。

GPT-5.4的定价略高于GPT-5.2，但由于任务所需Token减少，总体成本可能并不会上升太多。

通过引入工具搜索机制，GPT-5.4在保持准确率的情况下，将总Token使用率降低了47%。

🏷️