英伟达推出Nemotron 3 Super,一款用于大规模人工智能系统的1200亿参数开放模型

英伟达推出Nemotron 3 Super,一款用于大规模人工智能系统的1200亿参数开放模型

💡 原文英文,约700词,阅读约需3分钟。
📝

内容提要

英伟达推出了Nemotron 3 Super模型,具备1200亿参数和100万令牌的上下文窗口,专注于速度和效率优化。该模型可在多个云平台上使用,推理时可调用更多专家。尽管智能评分略低于领先模型,但速度表现优异,每秒可输出478个令牌。

🎯

关键要点

  • 英伟达推出了Nemotron 3 Super模型,具备1200亿参数和100万令牌的上下文窗口,专注于速度和效率优化。
  • Nemotron 3 Super可在多个云平台上使用,包括Google Cloud、Oracle Cloud和即将上线的Amazon Bedrock和Microsoft Azure。
  • 该模型使用混合潜在专家和Mamaba-Transformer架构,能够在推理时调用更多专家,且内存开销较小。
  • 模型的整体智能评分为36,略高于gpt-oss-120B的33分,但低于领先模型如Gemini 3.1 Pro和GPT-5.4。
  • Nemotron 3 Super在速度上表现优异,每秒可输出478个令牌,超过了所有之前的模型。

延伸问答

Nemotron 3 Super模型的主要特点是什么?

Nemotron 3 Super模型具备1200亿参数和100万令牌的上下文窗口,专注于速度和效率优化。

Nemotron 3 Super模型在哪些云平台上可用?

该模型可在Google Cloud、Oracle Cloud、Amazon Bedrock和Microsoft Azure等多个云平台上使用。

Nemotron 3 Super的推理速度如何?

Nemotron 3 Super每秒可输出478个令牌,速度超过所有之前的模型。

Nemotron 3 Super与其他模型相比的智能评分如何?

Nemotron 3 Super的整体智能评分为36,略高于gpt-oss-120B的33分,但低于Gemini 3.1 Pro和GPT-5.4。

Nemotron 3 Super使用了什么样的架构?

该模型使用混合潜在专家和Mamaba-Transformer架构,能够在推理时调用更多专家,且内存开销较小。

Nemotron 3 Super的训练数据来源是什么?

该模型是基于其他前沿推理模型的合成数据进行训练,并发布了超过10万亿个训练数据集。

➡️

继续阅读