小红花·文摘 - 小红花技术领袖俱乐部

英伟达推出的Llama Nemotron Super v1.5开源模型专为复杂推理和智能体任务设计，吞吐量提升三倍，单卡高效运行。该模型通过神经架构搜索优化，兼顾准确性与效率，适合英语对话和编程任务。

英伟达全新开源模型：三倍吞吐、单卡可跑，还拿下推理SOTA

量子位 ·

NVIDIA AI 开发团队发布 Llama Nemotron Super v1.5：为推理和代理 AI 树立新标准

NVIDIA AI 开发团队发布 Llama Nemotron Super v1.5：为推理和代理 AI 树立新标准

实时互动网 ·

Llama-Nemotron：高效推理大模型的技术突破与应用前景

Llama-Nemotron：高效推理大模型的技术突破与应用前景

我爱自然语言处理 ·

Llama-Nemotron：2.5倍速度提升的AI推理，保持准确性

Llama-Nemotron：2.5倍速度提升的AI推理，保持准确性

DEV Community ·

在DeepSeek之后，NVIDIA在GTC大会上将重点放在推理上

在DeepSeek之后，NVIDIA在GTC大会上将重点放在推理上

The New Stack ·

NVIDIA宣布推出Nemotron模型系列，以推动智能代理AI的发展

NVIDIA宣布推出Nemotron模型系列，以推动智能代理AI的发展

NVIDIA Blog ·