刚刚,OpenAI开源2个推理模型:笔记本/手机就能跑,性能接近o4-mini

💡 原文中文,约3600字,阅读约需9分钟。
📝

内容提要

OpenAI开源了两个推理模型gpt-oss-120b和gpt-oss-20b,分别拥有1170亿和210亿参数,支持在笔记本和手机上运行。它们的推理性能接近闭源模型,但在复杂任务中稍显不足。此举旨在推动AI民主化,降低使用门槛,促进创新。

🎯

关键要点

  • OpenAI开源了两个推理模型:gpt-oss-120b和gpt-oss-20b,分别拥有1170亿和210亿参数。
  • 这两个模型支持在笔记本和手机上运行,性能接近闭源模型,但在复杂任务中稍显不足。
  • gpt-oss-120b可在单张80GB GPU上运行,gpt-oss-20b可在16GB内存的消费级设备上运行。
  • 这两个模型采用Apache 2.0许可证,允许商用无需付费或授权。
  • 在工具使用、少样本函数调用和链式思考推理方面表现强劲,甚至超越了OpenAI的专有模型。
  • gpt-oss模型使用了最先进的预训练和后训练技术,特别关注推理效率和实际可用性。
  • 模型采用专家混合(MoE)架构,减少处理输入所需的活跃参数数量。
  • OpenAI希望通过开源模型推动AI民主化,降低使用门槛,促进创新。
  • 这些开源模型为开发者提供了更多工具选项,加速前沿研究,支持更安全、透明的AI开发。
  • OpenAI强调,开发者不应直接展示模型的链式思维内容,以避免虚构或有害信息的传播。
➡️

继续阅读