小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
在NVIDIA Blackwell上优化GPT-OSS性能:推动帕累托前沿

vLLM与NVIDIA合作,在Blackwell GPU上优化gpt-oss-120b模型,提升性能。通过FlashInfer集成、内核融合和运行时改进,实现最大吞吐量提高38%和最佳交互性提升13%。这些优化增强了模型在高并发场景下的表现。

在NVIDIA Blackwell上优化GPT-OSS性能:推动帕累托前沿

vLLM Blog
vLLM Blog · 2026-02-01T00:00:00Z
通过自动化提示优化构建最先进的企业代理,成本降低90倍

Databricks Agent Bricks是一个企业AI代理构建与优化的平台。通过自动化提示优化技术,gpt-oss-120b模型在信息提取任务中超越了Claude Opus 4.1,且服务成本低90倍。此外,该技术还提升了其他专有模型的性能,提供了优于监督微调的质量-成本平衡,适合企业应用。

通过自动化提示优化构建最先进的企业代理,成本降低90倍

Databricks
Databricks · 2025-09-24T21:25:00Z
Heroku AI扩展模型产品,推出OpenAI的gpt-oss-120b

OpenAI推出了gpt-oss-120b开源模型,拥有1200亿参数和混合专家架构,适用于文本生成和理解。开发者可根据Apache 2.0许可证进行调整,支持实时任务执行。该模型性能与OpenAI的o4-mini相当,并可在Heroku平台上简化AI基础设施,提供透明定价。

Heroku AI扩展模型产品,推出OpenAI的gpt-oss-120b

Heroku
Heroku · 2025-08-20T15:00:14Z

OpenAI发布了gpt-oss-120b和gpt-oss-20b两款开源大模型,前者适合复杂推理,后者适合低延迟应用。gpt-oss采用MoE架构,性能强大且计算需求低,支持在消费级硬件上运行。评测显示,gpt-oss-120b在多个任务中优于o3-mini,gpt-oss-20b表现也很出色。用户可通过HyperAI官网体验和部署这些模型。

一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini

HyperAI超神经
HyperAI超神经 · 2025-08-11T02:43:04Z
OpenAI发布gpt-oss-120b和gpt-oss-20b,开放权重语言模型,支持本地部署

OpenAI发布了gpt-oss-120b和gpt-oss-20b两个开放权重语言模型,支持高效推理和工具使用。120b模型可在单个80GB GPU上运行,超越o4-mini;20b模型适合16GB内存的消费级硬件,支持本地推理。两者可配置推理力度,适用于多种应用场景。模型经过风险评估,并接受外部专家审查,推出红队挑战以进一步评估。

OpenAI发布gpt-oss-120b和gpt-oss-20b,开放权重语言模型,支持本地部署

InfoQ
InfoQ · 2025-08-08T05:00:00Z

OpenAI发布了gpt-oss-120b和gpt-oss-20b两个开源大模型,前者适合复杂推理,后者适合低延迟应用。两者在多项测试中表现优异,能够在消费级硬件上运行,满足多场景需求。

一键部署 gpt-oss-20b,实测开源推理模型新 SOTA,性能直逼 o3‑mini

HyperAI超神经
HyperAI超神经 · 2025-08-07T19:32:43Z
人工智能周刊第318期 - OpenAI开放源代码模型,Opus 4.1,Gemini 2.5 深度思考

OpenAI发布了两个开放权重的AI推理模型gpt-oss-120b和gpt-oss-20b,供免费下载。gpt-oss-120b可在单个Nvidia GPU上运行,而gpt-oss-20b适用于16GB内存的笔记本电脑。这是自GPT-2以来首次发布的开放语言模型。

人工智能周刊第318期 - OpenAI开放源代码模型,Opus 4.1,Gemini 2.5 深度思考

Last Week in AI
Last Week in AI · 2025-08-06T22:08:11Z
OpenAI 开源模型 gpt-oss,只需要 16GB 显存。目前可在线试用

OpenAI 开源了两款轻量级语言模型 gpt-oss-120b 和 gpt-oss-20b,均基于 Transformer 架构,支持商用。gpt-oss-120b 拥有 1170 亿参数,适合高性能需求;gpt-oss-20b 拥有 210 亿参数,适合边缘设备。两者可在 Hugging Face 下载和在线试用。

OpenAI 开源模型 gpt-oss,只需要 16GB 显存。目前可在线试用

小众软件
小众软件 · 2025-08-06T08:30:16Z
亚马逊云科技首次上线OpenAI开放权重模型

亚马逊云科技宣布,OpenAI的开放权重模型首次通过Amazon Bedrock和SageMaker AI可用,助力客户构建生成式AI应用。新模型gpt-oss-120b和gpt-oss-20b提供强大技术,支持高效Agent部署,具备生产级扩展性与安全性。

亚马逊云科技首次上线OpenAI开放权重模型

全球TMT-美通国际
全球TMT-美通国际 · 2025-08-06T04:28:52Z
gpt-oss-120b 和 gpt-oss-20b 模型卡

OpenAI推出了gpt-oss-120b和gpt-oss-20b两个开放权重推理模型,旨在支持指令执行和工具使用。尽管模型遵循安全政策,但仍需额外保护以防滥用。评估结果显示,gpt-oss-120b在生物、化学和网络能力方面未达到高标准,且未能显著提升开放基础模型的生物能力。

gpt-oss-120b 和 gpt-oss-20b 模型卡

OpenAI
OpenAI · 2025-08-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码