刚刚,OpenAI发布2款开源模型!手机笔记本也能跑,北大校友扛大旗

刚刚,OpenAI发布2款开源模型!手机笔记本也能跑,北大校友扛大旗

💡 原文中文,约8000字,阅读约需19分钟。
📝

内容提要

OpenAI发布了两款开源语言模型gpt-oss-120b和gpt-oss-20b,标志着五年来的首次开源。gpt-oss-120b适合高推理需求,能在单个H100 GPU上运行,而gpt-oss-20b则适用于低延迟场景。两款模型均支持微调,具备强大的智能Agent能力,显示出OpenAI在开源领域的重大转变。

🎯

关键要点

  • OpenAI发布了两款开源语言模型gpt-oss-120b和gpt-oss-20b,标志着五年来的首次开源。
  • gpt-oss-120b适合高推理需求,能在单个H100 GPU上运行,参数量为1170亿。
  • gpt-oss-20b适用于低延迟场景,参数量为21亿,能在大多数台式机和笔记本电脑上运行。
  • 两款模型均支持微调,具备强大的智能Agent能力,适合实验、定制和商业部署。
  • OpenAI采用Apache 2.0许可证,允许开发者自由构建和使用模型。
  • gpt-oss-120b在多个基准测试中表现优异,接近闭源旗舰模型的水平。
  • gpt-oss-20b在竞赛数学和健康领域表现突出,尽管参数规模较小。
  • OpenAI在模型训练中采用了先进的Transformer架构和专家混合技术,提升了推理效率。
  • OpenAI进行了安全性测试,确保模型不会被恶意使用。
  • OpenAI与多家第三方平台合作,确保模型在不同系统上的优化性能。
  • 此次开源发布的意义在于赋能开发者和企业,提供更多选择和灵活性。

延伸问答

OpenAI发布了哪些开源模型?

OpenAI发布了gpt-oss-120b和gpt-oss-20b两款开源模型。

gpt-oss-120b和gpt-oss-20b的主要区别是什么?

gpt-oss-120b适合高推理需求,参数量为1170亿,能在单个H100 GPU上运行;而gpt-oss-20b适用于低延迟场景,参数量为21亿,能在大多数台式机和笔记本上运行。

这两款模型的许可证是什么?

这两款模型采用Apache 2.0许可证,允许开发者自由构建和使用。

gpt-oss-120b在基准测试中的表现如何?

gpt-oss-120b在多个基准测试中表现优异,接近闭源旗舰模型的水平。

OpenAI如何确保模型的安全性?

OpenAI进行了安全性测试,过滤掉有害数据,并使用对齐技术教导模型拒绝不安全的提示。

这次开源发布对开发者有什么意义?

此次开源发布赋能开发者和企业,提供更多选择和灵活性,支持实验、定制和商业部署。

➡️

继续阅读