爱范儿 ·

刚刚，GPT-5.6 正式发布，史上最强但被自己坑惨了

💡 原文中文，约4400字，阅读约需11分钟。

📝

内容提要

OpenAI发布了GPT-5.6系列，包括Sol、Terra和Luna三款模型，分别针对复杂任务、日常工作和低成本应用。Sol在编程、生物信息学和网络安全方面表现突出，具备更强的推理能力和效率。模型将以有限预览方式向少数可信合作伙伴开放，并需遵循美国政府的审查，反映出AI模型发布与国家安全的紧密关联。

🎯

关键要点

OpenAI发布了GPT-5.6系列，包括Sol、Terra和Luna三款模型，分别针对复杂任务、日常工作和低成本应用。
Sol是旗舰模型，专注于编程、生物信息学和网络安全，具备更强的推理能力和效率。
GPT-5.6系列以有限预览方式向少数可信合作伙伴开放，需遵循美国政府的审查，反映出AI模型发布与国家安全的紧密关联。
Sol在编程场景中表现突出，能够进行复杂的命令行操作，基准测试成绩优于前代模型。
在生物信息学方面，Sol在GeneBench v1评测中表现出色，能够在更少的tokens下取得更强结果。
网络安全方面，Sol被称为最强的网络安全模型，但尚未达到完全自主生成攻击链的能力。
OpenAI为不同模型配置了分级防护体系，确保合法使用场景的同时抑制攻击性用途。
GPT-5.6的发布流程受到美国政府的影响，模型访问需经过政府审核，反映出AI模型与国家安全的关联性。

🔎

延伸解读

模型分层与应用场景

GPT-5.6系列的发布不仅是技术的升级，更是OpenAI对产品线的重新分层。Sol、Terra和Luna分别针对复杂任务、日常工作和低成本应用，用户可以根据需求选择合适的模型。这种分层有助于企业在不同场景下更高效地利用AI技术，尤其是在编程和生物信息学等领域。

安全性与政府审查

GPT-5.6的发布受到美国政府的审查，反映出AI技术与国家安全的紧密关联。OpenAI在模型中引入了分级防护体系，以确保合法使用场景的同时抑制潜在的攻击性用途。这种审查机制可能会影响模型的开放程度，用户需关注未来的使用政策和访问权限。

性能与成本效率

Sol在生物信息学领域的表现尤为突出，能够在更少的tokens下取得更强的结果。这对于科研团队和企业研发来说，意味着在保持高效分析的同时，降低了调用成本。用户在选择模型时，应考虑其在特定应用场景下的成本效益。

❓

延伸问答

GPT-5.6系列包含哪些模型？

GPT-5.6系列包含Sol、Terra和Luna三款模型，分别针对复杂任务、日常工作和低成本应用。

Sol模型在编程方面的表现如何？

Sol在编程场景中表现突出，能够进行复杂的命令行操作，基准测试成绩优于前代模型。

GPT-5.6的发布受到哪些因素影响？

GPT-5.6的发布受到美国政府的审查影响，模型访问需经过政府审核，反映出AI模型与国家安全的关联性。

Sol模型在生物信息学方面的优势是什么？

Sol在GeneBench v1评测中表现出色，能够在更少的tokens下取得更强结果，提升了科研工作流的成本效率。

OpenAI如何确保GPT-5.6的安全性？

OpenAI为不同模型配置了分级防护体系，确保合法使用场景的同时抑制攻击性用途，并引入实时分类器检测高风险内容。

GPT-5.6的定价策略是什么？

GPT-5.6按每百万tokens计费，Sol输入5美元、输出30美元；Terra输入2.5美元、输出15美元；Luna输入1美元、输出6美元。

🏷️