小众软件 ·

OpenAI 开源模型 gpt-oss，只需要 16GB 显存。目前可在线试用

💡 原文中文，约1000字，阅读约需3分钟。

📝

内容提要

OpenAI 开源了两款轻量级语言模型 gpt-oss-120b 和 gpt-oss-20b，均基于 Transformer 架构，支持商用。gpt-oss-120b 拥有 1170 亿参数，适合高性能需求；gpt-oss-20b 拥有 210 亿参数，适合边缘设备。两者可在 Hugging Face 下载和在线试用。

🎯

关键要点

OpenAI 开源了两款轻量级语言模型：gpt-oss-120b 和 gpt-oss-20b。
这两款模型基于 Transformer 架构，采用 Apache 2.0 许可证，可商用。
gpt-oss-120b 拥有 1170 亿参数，适合高性能需求；gpt-oss-20b 拥有 210 亿参数，适合边缘设备。
两者支持最长 128k 的上下文长度。
gpt-oss-120b 在核心推理测试中性能接近 OpenAI 的闭源 o4-mini 模型，适合单个 80GB GPU 运行。
gpt-oss-20b 性能接近 o3-mini 模型，仅需 16GB 内存，适合边缘设备和本地推理应用。
模型训练使用了主要为英文的纯文本数据集，重点关注 STEM、编程和通用知识领域。
gpt-oss-120b 和 gpt-oss-20b 可在 Hugging Face 下载和在线试用。
建议个人用户尝试 gpt-oss-20b 模型，因其显存需求较低。

❓

延伸问答

gpt-oss-120b 和 gpt-oss-20b 有什么区别？

gpt-oss-120b 拥有 1170 亿参数，适合高性能需求，而 gpt-oss-20b 拥有 210 亿参数，适合边缘设备。

这两款模型的上下文长度是多少？

gpt-oss-120b 和 gpt-oss-20b 支持最长 128k 的上下文长度。

gpt-oss-20b 模型适合什么样的用户？

建议个人用户尝试 gpt-oss-20b 模型，因为它仅需 16GB 显存，适合边缘设备和本地推理应用。

如何在线试用 gpt-oss 模型？

可以直接访问 https://gpt-oss.com/ 在线试用这两个模型。

gpt-oss 模型的训练数据集主要包含什么内容？

模型训练使用了主要为英文的纯文本数据集，重点关注 STEM、编程和通用知识领域。

gpt-oss-120b 在性能上与哪个模型接近？

gpt-oss-120b 在核心推理测试中性能接近 OpenAI 的闭源 o4-mini 模型。

🏷️

继续阅读

OpenAI 和微软官宣「分手」，七年 CP 终成塑料
微软与OpenAI修订合作协议，解除云合作独家限制，知识产权授权变为非独家，并设定收入分成上限。双方关系转向多元化，OpenAI开始独立发展，微软也启动自...
早报｜小米玄戒O1出货破百万，未来还将「上车」/OpenAI与微软「分手」/小红书发布首份AI治理主张
OpenAI 正在与联发科和高通合作开发新款手机处理器，预计2028年量产，立讯精密为独家制造商。新手机将由 AI 智能体直接调度用户任务，采用云端与端侧...
微软与OpenAI的重写为Anthropic和谷歌打开了大门
OpenAI与微软重新调整合作协议，旨在简化合作方式并增强灵活性。OpenAI将能够在其他云平台提供服务，而微软希望发展自己的AI模型。尽管两者关系紧张，...
微软与OpenAI的著名AGI协议已死
微软与OpenAI的合作关系发生重大变化，取消了关于人工通用智能（AGI）的条款。OpenAI现在可以向任何云服务提供商提供产品，虽然微软仍是主要云合作伙...
埃隆·马斯克与山姆·阿尔特曼关于OpenAI未来的法律斗争
埃隆·马斯克与山姆·阿尔特曼之间的法律斗争即将开始，涉及OpenAI的未来。马斯克指控OpenAI偏离了最初使命，追求利润，并要求解除阿尔特曼和布罗克曼的...
OpenAI获得FedRAMP Moderate授权
OpenAI获得了FedRAMP 20x Moderate授权，使美国政府机构能够安全使用ChatGPT企业版和API平台。这一授权简化了云服务的安全配置...