💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
Groq与沙特HUMAIN联合发布了支持128K上下文和实时响应的OpenAI gpt-oss-120B和gpt-oss-20B模型。GroqCloud平台优化了推理速度与成本,其中gpt-oss-120B以500+ t/s运行,gpt-oss-20B以1000+ t/s运行。
🎯
关键要点
- Groq与沙特HUMAIN联合发布了OpenAI的gpt-oss-120B和gpt-oss-20B模型。
- 新模型支持128K上下文和实时响应能力。
- GroqCloud平台优化了推理速度与成本。
- gpt-oss-120B在GroqCloud上以500+ t/s的速度运行。
- gpt-oss-20B在GroqCloud上以1000+ t/s的速度运行。
- Groq支持OpenAI的开源项目,包括Whisper模型的大规模部署。
- HUMAIN提供全球接入能力与本地化支持,助力模型投入生产应用。
- Groq的技术堆栈保证了速度与准确性,并实现了最低每令牌成本。
🏷️
标签
➡️