我爱自然语言处理 ·

OpenAI gpt-oss-120b & gpt-oss-20b 模型技术报告英中对照版

💡 原文中文，约1200字，阅读约需3分钟。

📝

内容提要

OpenAI发布的gpt-oss-120b和gpt-oss-20b是开源推理模型，性能优越，特别在代码和多语言处理上表现突出。模型经过严格的安全评估，开发者需负责内容审核。这种开放性和可控风险的新模式吸引了本地化和定制开发者，推动了安全可验证的开源大模型发展。

🎯

🔎

gpt-oss-120b和20b在数学、科学和代码处理上表现出色，尤其在多语言和医疗问答领域展现了潜力。120b在HealthBench上的表现接近o3，意味着其在低成本健康咨询中的应用前景广阔。开发者可以利用这些模型在特定领域实现高效的解决方案。

开放权重虽然带来了灵活性，但也伴随安全风险。OpenAI通过“红队微调”实验确保模型未触及高风险阈值，提供了可信的风险评估。然而，开发者仍需承担内容审核的责任，增加了工程实施的复杂性。

gpt-oss-120b和20b的Apache 2.0许可证和量化技术显著降低了运行门槛，120b仅需80GB GPU，20b仅需16GB。这使得本地部署变得更加可行，吸引了更多开发者进行定制化开发。

❓

这两个模型是开源推理模型，强调强推理和工具调用，性能优越，特别在代码和多语言处理上表现突出。

gpt-oss-120b在AIME、GPQA等基准上表现接近o4-mini，显示出其强大的推理能力。

开放权重可能导致内容审核责任下沉，开发者需自行进行内容审核和防护，增加了工程要求。

gpt-oss-20b模型在Apache 2.0许可证下运行，仅需16 GB的GPU，门槛较低。

OpenAI进行了“红队微调”实验，结果显示风险未触及高风险阈值，并邀请外部专家复核，提供可信的风险锚点。

这两个模型提供可商用、可微调的强模型，适合追求本地私有化和深度定制的开发者，降低了二次开发成本。

🏷️