OpenAI发布gpt-oss-120b和gpt-oss-20b，开放权重语言模型，支持本地部署

InfoQ ·

OpenAI发布gpt-oss-120b和gpt-oss-20b，开放权重语言模型，支持本地部署

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

OpenAI发布了gpt-oss-120b和gpt-oss-20b两个开放权重语言模型，支持高效推理和工具使用。120b模型可在单个80GB GPU上运行，超越o4-mini；20b模型适合16GB内存的消费级硬件，支持本地推理。两者可配置推理力度，适用于多种应用场景。模型经过风险评估，并接受外部专家审查，推出红队挑战以进一步评估。

🎯

关键要点

OpenAI发布了gpt-oss-120b和gpt-oss-20b两个开放权重语言模型，支持高效推理和工具使用。
gpt-oss-120b模型在单个80GB GPU上运行，超越o4-mini，激活每个token的5.1亿参数。
gpt-oss-20b模型适合16GB内存的消费级硬件，支持本地推理，激活3.6亿参数。
两个模型支持链式推理、工具使用和结构化输出，开发者可配置推理力度。
模型使用了旋转位置嵌入和分组多查询注意力，支持128k上下文长度，经过多项基准测试评估。
OpenAI未对模型的链式推理进行直接监督，允许研究人员研究潜在问题。
OpenAI进行了最坏情况微调，使用生物和网络安全领域的对抗数据评估风险。
外部专家审查结果影响了模型的最终发布，OpenAI推出了红队挑战以进一步评估模型。
模型可在Hugging Face和多个部署平台上获取，20B模型可在本地运行，需16GB内存。
微软将通过ONNX Runtime为Windows带来20B模型的GPU优化版本。

❓

延伸问答

gpt-oss-120b和gpt-oss-20b模型的主要特点是什么？

gpt-oss-120b模型支持在单个80GB GPU上运行，激活每个token的5.1亿参数；gpt-oss-20b模型适合16GB内存的消费级硬件，激活3.6亿参数，支持本地推理。

这两个模型支持哪些应用场景？

这两个模型支持链式推理、工具使用和结构化输出，开发者可以配置推理力度以平衡速度和准确性。

gpt-oss-20b模型的硬件要求是什么？

gpt-oss-20b模型需要至少16GB的内存，可以在消费级硬件上运行。

OpenAI如何评估这些模型的风险？

OpenAI通过使用生物和网络安全领域的对抗数据进行最坏情况微调，评估模型的风险，并进行了外部专家审查。

gpt-oss模型的训练技术有哪些？

gpt-oss模型使用旋转位置嵌入、分组多查询注意力，并支持128k的上下文长度。

如何获取gpt-oss模型？

gpt-oss模型可以在Hugging Face和多个部署平台上获取，20B模型可在本地运行。

🏷️

继续阅读

亚马逊云科技大幅扩展与OpenAI的合作伙伴关系
亚马逊云科技宣布与OpenAI扩大合作，推出最新的OpenAI模型和编程Agent Codex，支持企业软件开发。新产品通过Amazon Bedrock提...
埃隆·马斯克与山姆·阿尔特曼关于OpenAI未来的法律斗争
埃隆·马斯克与山姆·阿尔特曼之间的法律斗争即将开始，涉及OpenAI的未来。马斯克指控OpenAI偏离了最初使命，追求利润，并要求解除阿尔特曼和布罗克曼的...
埃隆·马斯克在对OpenAI的高调审判中作证
埃隆·马斯克在与OpenAI首席执行官萨姆·阿尔特曼的诉讼中作证，指控OpenAI违反其造福人类的人工通用智能（AGI）使命。他要求法院剥夺阿尔特曼和公司...
开源版的 GPT Image 2，信息图、连续图文、本地部署全拿下｜商汤SenseNova U1实测
SenseNova U1 是商汤发布的开源多模态模型，具备连续图文生成能力，能够同时生成文字和图片。该模型在信息图生成方面表现出色，采用 NEO-unif...
ChatGPT 拎包入住云计算一哥，你的下一任好同事可能是 AI
亚马逊云科技发布会强调AI Agent将重塑SaaS行业。新产品Amazon Quick通过整合信息提高工作效率，减少员工在多个系统间的切换。亚马逊与Op...
刚刚，“云计算一哥”版龙虾发布，奥特曼打着官司也要云站台
亚马逊云科技推出了Amazon Quick智能助手，能够无缝连接本地文件和应用，自动安排会议和准备材料。同时，OpenAI最新模型接入Amazon Bed...