The New Stack ·

英伟达推出Nemotron 3 Super，一款用于大规模人工智能系统的1200亿参数开放模型

💡 原文英文，约700词，阅读约需3分钟。

📝

内容提要

英伟达推出了Nemotron 3 Super模型，具备1200亿参数和100万令牌的上下文窗口，专注于速度和效率优化。该模型可在多个云平台上使用，推理时可调用更多专家。尽管智能评分略低于领先模型，但速度表现优异，每秒可输出478个令牌。

🎯

英伟达推出了Nemotron 3 Super模型，具备1200亿参数和100万令牌的上下文窗口，专注于速度和效率优化。
Nemotron 3 Super可在多个云平台上使用，包括Google Cloud、Oracle Cloud和即将上线的Amazon Bedrock和Microsoft Azure。
该模型使用混合潜在专家和Mamaba-Transformer架构，能够在推理时调用更多专家，且内存开销较小。
模型的整体智能评分为36，略高于gpt-oss-120B的33分，但低于领先模型如Gemini 3.1 Pro和GPT-5.4。
Nemotron 3 Super在速度上表现优异，每秒可输出478个令牌，超过了所有之前的模型。

🔎

Nemotron 3 Super采用混合潜在专家和Mamaba-Transformer架构，使其在推理时能够调用更多专家，且内存开销较小。这种设计使得模型在处理长任务时能够更好地跟踪上下文，适合复杂的人工智能系统。

尽管Nemotron 3 Super的智能评分略低于市场领先模型，但其每秒输出478个令牌的速度表现优异，远超其他模型。这使得它在需要快速响应的应用场景中具有明显优势，尤其是在大规模部署时。

该模型可在多个云平台上使用，包括Google Cloud和Oracle Cloud等，未来还将支持Amazon Bedrock和Microsoft Azure。这种多平台的可用性为企业提供了灵活性，便于根据自身需求选择合适的云服务。

❓

Nemotron 3 Super模型具备1200亿参数和100万令牌的上下文窗口，专注于速度和效率优化。

该模型可在Google Cloud、Oracle Cloud、Amazon Bedrock和Microsoft Azure等多个云平台上使用。

Nemotron 3 Super每秒可输出478个令牌，速度超过所有之前的模型。

Nemotron 3 Super的整体智能评分为36，略高于gpt-oss-120B的33分，但低于Gemini 3.1 Pro和GPT-5.4。

该模型使用混合潜在专家和Mamaba-Transformer架构，能够在推理时调用更多专家，且内存开销较小。

该模型是基于其他前沿推理模型的合成数据进行训练，并发布了超过10万亿个训练数据集。

🏷️