💡
原文英文,约700词,阅读约需3分钟。
📝
内容提要
英伟达推出了Nemotron 3 Super模型,具备1200亿参数和100万令牌的上下文窗口,专注于速度和效率优化。该模型可在多个云平台上使用,推理时可调用更多专家。尽管智能评分略低于领先模型,但速度表现优异,每秒可输出478个令牌。
🎯
关键要点
- 英伟达推出了Nemotron 3 Super模型,具备1200亿参数和100万令牌的上下文窗口,专注于速度和效率优化。
- Nemotron 3 Super可在多个云平台上使用,包括Google Cloud、Oracle Cloud和即将上线的Amazon Bedrock和Microsoft Azure。
- 该模型使用混合潜在专家和Mamaba-Transformer架构,能够在推理时调用更多专家,且内存开销较小。
- 模型的整体智能评分为36,略高于gpt-oss-120B的33分,但低于领先模型如Gemini 3.1 Pro和GPT-5.4。
- Nemotron 3 Super在速度上表现优异,每秒可输出478个令牌,超过了所有之前的模型。
❓
延伸问答
Nemotron 3 Super模型的主要特点是什么?
Nemotron 3 Super模型具备1200亿参数和100万令牌的上下文窗口,专注于速度和效率优化。
Nemotron 3 Super模型在哪些云平台上可用?
该模型可在Google Cloud、Oracle Cloud、Amazon Bedrock和Microsoft Azure等多个云平台上使用。
Nemotron 3 Super的推理速度如何?
Nemotron 3 Super每秒可输出478个令牌,速度超过所有之前的模型。
Nemotron 3 Super与其他模型相比的智能评分如何?
Nemotron 3 Super的整体智能评分为36,略高于gpt-oss-120B的33分,但低于Gemini 3.1 Pro和GPT-5.4。
Nemotron 3 Super使用了什么样的架构?
该模型使用混合潜在专家和Mamaba-Transformer架构,能够在推理时调用更多专家,且内存开销较小。
Nemotron 3 Super的训练数据来源是什么?
该模型是基于其他前沿推理模型的合成数据进行训练,并发布了超过10万亿个训练数据集。
➡️