麦克船长的技术、产品与商业博客 ·

时隔六年再开源，OpenAI 发布两款语言模型，主打端侧场景

💡 原文中文，约2500字，阅读约需6分钟。

📝

内容提要

OpenAI于2025年发布了两款开源语言模型gpt-oss-120b和gpt-oss-20b，支持128k上下文，性能接近其商用模型。模型采用Transformer-MoE架构，具备强大的工具使用能力，并设立安全评估机制，标志着开源大模型领域的重要进展。

🎯

关键要点

OpenAI于2025年发布了两款开源语言模型gpt-oss-120b和gpt-oss-20b。
这两款模型支持128k上下文，性能接近商用模型。
模型采用Transformer-MoE架构，具备强大的工具使用能力。
gpt-oss-120b和gpt-oss-20b分别有116.8b和20.9b参数，支持长上下文和多种推理模式。
gpt-oss-120b在多个评测中与OpenAI商用模型表现相当，gpt-oss-20b在某些任务中表现优于gpt-o3-mini。
模型使用了新的o200k_harmony分词器，训练数据主要集中在STEM和代码领域。
OpenAI首次公开了针对模型的恶意微调极限测试，结果显示模型在安全性方面仍有不足。
OpenAI设立了50万美元的奖金池，鼓励研究者发现新型安全问题。
模型的生态系统覆盖云服务、推理框架和硬件厂商，支持多种部署方式。
gpt-oss的发布标志着开源大模型领域的重要进展，可能引发新一轮创新浪潮。

❓

延伸问答

OpenAI发布了哪两款开源语言模型？

OpenAI发布了gpt-oss-120b和gpt-oss-20b两款开源语言模型。

这两款模型的参数和上下文支持是什么？

gpt-oss-120b有116.8亿参数，gpt-oss-20b有20.9亿参数，均支持128k上下文。

gpt-oss-120b和gpt-oss-20b的性能如何？

gpt-oss-120b在多个评测中表现与OpenAI商用模型相当，gpt-oss-20b在某些任务中表现优于gpt-o3-mini。

这两款模型采用了什么架构？

这两款模型采用了Transformer-MoE架构。

OpenAI如何评估模型的安全性？

OpenAI首次公开了针对模型的恶意微调极限测试，并设立了50万美元的奖金池以鼓励研究者发现新型安全问题。

gpt-oss模型的生态系统包括哪些方面？

gpt-oss的生态系统覆盖云服务、推理框架和硬件厂商，支持多种部署方式。

🏷️

继续阅读

埃隆·马斯克与山姆·阿尔特曼关于OpenAI未来的法律斗争
埃隆·马斯克与山姆·阿尔特曼之间的法律斗争即将开始，涉及OpenAI的未来。马斯克指控OpenAI偏离了最初使命，追求利润，并要求解除阿尔特曼和布罗克曼的...
AWS与OpenAI在Bedrock上合作，但Trainium才是真正的焦点
AWS宣布与OpenAI和Anthropic达成长期合作，推出新产品Bedrock，整合GPT-5和Codex，提升云端AI推理能力。两家公司将使用AWS...
Tumbler Ridge家庭起诉OpenAI，指控其未向警方通报嫌疑人使用ChatGPT的活动
七个在加拿大Tumbler Ridge学校枪击事件中受害的家庭起诉OpenAI及其首席执行官Sam Altman，指控其未能向警方报告嫌疑人使用ChatG...
ChatGPT下载量放缓——这可能会给OpenAI的IPO带来问题
ChatGPT的用户增长放缓，尤其是与竞争对手Claude相比。根据Sensor Tower的数据，ChatGPT在4月的卸载率同比增长413%。尽管用户...
本地可跑的隐私检测模型：Privacy Filter 低成本实现高质量 PII 过滤；硬核开源！涵盖超 8 万场比赛的 Transfermarkt 结构化足球数据集
Privacy Filter 是 OpenAI 开源的双向标记分类模型，专门用于检测和屏蔽文本中的个人身份信息。该模型基于小型预训练架构，采用高效的片段解码方式。
早报｜苹果iOS 27或大幅升级照片App/曝一加、realme正式合并/去年我国Token调用量达21100万亿
马斯克与OpenAI的官司已开庭，马斯克指控OpenAI盗用慈善机构，索赔超过1500亿美元。他自称是OpenAI的实际推动者，但表现不如预期。OpenA...