The New Stack ·

Nvidia推出下一代Nemotron模型

💡 原文英文，约900词，阅读约需4分钟。

📝

内容提要

Nvidia推出Nemotron 3系列AI模型，包括Nano、Super和Ultra，首次发布三万亿个预训练数据和1800万后训练样本。Nano模型现已可用，Super和Ultra预计2026年上半年发布。新模型采用专家混合技术，提升性能并降低成本，支持多种应用，开发者可通过开源和商业平台使用。

🎯

关键要点

Nvidia推出Nemotron 3系列AI模型，包括Nano、Super和Ultra。
首次发布三万亿个预训练数据和1800万后训练样本。
Nano模型现已可用，Super和Ultra预计2026年上半年发布。
新模型采用专家混合技术，提升性能并降低成本。
Nano模型在HuggingFace上可用，适合特定任务。
Super模型为1000亿参数，适用于多代理应用。
Ultra模型为5000亿参数，适合复杂应用，但运行成本高。
开发者可通过开源和商业平台使用这些模型。
Nvidia自2019年开始构建自己的模型，旨在推动硬件极限。
Nvidia希望建立开放生态系统，促进开发者参与和模型改进。

🔎

延伸解读

新模型的技术优势

Nvidia的Nemotron 3系列采用了专家混合技术（MoE），使得模型在保持高性能的同时，显著降低了计算成本。这种技术允许模型在运行时只激活部分参数，从而提高了处理速度和效率。Nano模型的性能提升达到4倍，且生成答案所需的推理令牌减少了60%，这对开发者来说意味着更低的使用成本和更快的响应时间。

开放生态系统的意义

Nvidia希望通过建立开放的生态系统，鼓励开发者参与模型的改进和应用。通过提供开源模型和多种商业平台的支持，开发者可以根据自身需求进行定制和优化。这种开放性不仅促进了技术的共享，也为企业提供了更多的灵活性，以适应不同的应用场景。

模型选择的考量

在选择Nemotron 3系列模型时，开发者需要考虑具体的应用需求。Nano模型适合特定任务，Super模型则适用于多代理应用，而Ultra模型虽然功能强大，但运行成本较高。因此，开发者应根据项目预算和性能需求，合理选择合适的模型，以实现最佳的效果和成本效益。

❓

延伸问答

Nemotron 3系列模型有哪些版本？

Nemotron 3系列包括Nano、Super和Ultra三个版本。

Nano模型的特点是什么？

Nano模型具有30亿参数，采用专家混合技术，性能提升且运行成本低，适合特定任务。

Super和Ultra模型预计何时发布？

Super和Ultra模型预计在2026年上半年发布。

Nvidia为何要构建自己的AI模型？

Nvidia希望推动自身硬件的极限，并建立开放生态系统以促进开发者参与和模型改进。

Nemotron 3系列模型的开放性如何？

这些模型是开源的，开发者可以在自己的硬件上运行，也可以通过商业平台使用。

Ultra模型适合什么类型的应用？

Ultra模型具有5000亿参数，适合复杂应用，但运行成本较高。

🏷️