量子位 ·

老黄入局吃龙虾！英伟达发布最强开源Agent推理模型

💡 原文中文，约3200字，阅读约需8分钟。

📝

内容提要

英伟达发布了开源模型Nemotron 3 Super，参数达到120B，性能优越，吞吐量提升5倍。未来五年将投入260亿美元用于开源AI模型研发，推动技术进步并开放模型权重和部署手册。

🎯

关键要点

英伟达发布了开源模型Nemotron 3 Super，参数达到120B，性能优越。
Nemotron 3 Super在PinchBench测试中得分85.6%，在同类开源模型中排名第一。
英伟达未来五年将投入260亿美元用于开源AI模型研发。
Nemotron 3 Super支持100万token的上下文窗口，吞吐量提升至上一代的5倍。
模型在软件工程基准SWE-Bench中准确率为60.47%，高于GPT-OSS的41.9%。
Nemotron 3 Super采用混合Mamba-Transformer架构，优化了处理效率与精度。
模型引入Latent MoE架构，提升了专家网络的调用效率。
模型通过多token预测技术加速生成速度，缩短复杂任务的生成时间。
英伟达在后训练阶段通过多层级加固策略提升模型的智能体能力。
260亿美元的投资将用于构建开源AI模型，并进行计算、存储和网络性能的压力测试。
英伟达全面开放模型的参数权重和部署手册，推动开源生态的发展。

❓

延伸问答

Nemotron 3 Super模型的参数是多少？

Nemotron 3 Super模型的参数达到120B。

英伟达未来五年的投资计划是什么？

英伟达计划在未来五年内投入260亿美元用于开源AI模型研发。

Nemotron 3 Super在PinchBench测试中的表现如何？

Nemotron 3 Super在PinchBench测试中得分85.6%，排名第一。

Nemotron 3 Super的吞吐量相比上一代提升了多少？

Nemotron 3 Super的吞吐量提升至上一代的5倍。

Nemotron 3 Super采用了什么样的架构？

Nemotron 3 Super采用了混合Mamba-Transformer架构。

英伟达如何提升Nemotron 3 Super的智能体能力？

英伟达通过多层级加固策略和强化学习阶段对Nemotron 3 Super进行了全方位打磨。

🏷️

继续阅读

微软发布Surface RTX SPARK开发工作站利用英伟达芯片提供本地AI算力
微软推出了 Microsoft Surface RTX SPARK 开发工作站，搭载英伟达芯片，支持本地运行 AI 模型。该工作站配备 20 核心 CPU...
【公益译文】2026年AI指数报告（三）
AI模型在语言、推理、编码和数学等领域的能力迅速提升，评估工具的可靠性受到质疑。美国与中国的顶级模型差距缩小，竞争转向成本和实际应用价值。基准测试显示模型...
黄仁勋称美满电子将成为下一个万亿美元公司；SK海力士计划五年内将内存产能翻番；ChatGPT全球月活跃用户数突破10亿
黄仁勋表示，美满电子将成为下一个万亿美元公司。英伟达推出新PC处理器，SK海力士计划在五年内翻倍内存产能。ChatGPT月活跃用户数突破10亿，Space...
MiniMax M3一手实测：老黄PPT上74个Logo，我以为能难住它
MiniMax M3模型引发热议，提升了周用量限额并保持老用户设定。M3在长上下文、多模态和编程能力上表现突出，超越了GPT-5.5和Gemini 3.1...
大语言模型可解释性入门
文章讨论了大语言模型（LLM）的可解释性，强调动态评估的重要性。尽管LLM在AI领域取得了突破，其内部运作仍不透明。研究者提出了基于SMILE的框架，通过...
教你薅token：构建agent无关的AI工作流
目前使用AI的主要痛点是高昂的账单。用户可以通过维护良好的文档来优化使用流程，减少对高价Agent的依赖。合理利用免费资源可以节省开支，维护好文档有助于降...