量子位 ·

英伟达全新开源模型：三倍吞吐、单卡可跑，还拿下推理SOTA

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

英伟达推出的Llama Nemotron Super v1.5开源模型专为复杂推理和智能体任务设计，吞吐量提升三倍，单卡高效运行。该模型通过神经架构搜索优化，兼顾准确性与效率，适合英语对话和编程任务。

🎯

❓

Llama Nemotron Super v1.5模型专为复杂推理和智能体任务设计，吞吐量提升至前代的3倍，支持单卡高效运行，兼顾高准确性与低资源占用。

该模型采用神经架构搜索（NAS）优化架构，通过跳过注意力机制和可变前馈网络减少FLOPs，提高运行效率。

该模型特别适合英语对话和编程任务，能够在单个高性能GPU上高效运行。

Nemotron生态系统推出了Nano、Super和Ultra三种大语言模型系列，满足不同场景需求。

模型在FineWeb、Buzz-V1.2和Dolma数据集上进行了知识蒸馏，使用了来自公开语料库和人工合成的问答样本。

该模型现已开源，开发者可以在build.nvidia.com体验或从Hugging Face下载。

🏷️

人工智能缩水：为何Anthropic的Claude Opus 4.7可能不如其替代模型
Anthropic发布的Claude Opus 4.7模型引发用户不满，因其在复杂推理和分析方面表现不佳，用户反映模型常常自我怀疑，导致效率低下。分析师认...
定了，DeepSeek V4首发华为芯片！国产AI开始打破英伟达「垄断」
DeepSeek发布了V4系列模型，包括V4-Pro和V4-Flash，参数量分别为1.6T和284B，支持百万token上下文。V4-Pro在编程任务中...
最强开源模型 DeepSeek V4 发布，1M上下文，运行成本大降
DeepSeek V4 发布，具备 1M 上下文和显著提升的代码能力，推理性能接近顶尖模型。新注意力机制降低计算需求，支持更多请求。V4 Pro 价格上涨...
刚刚，GPT-5.5发布！内测英伟达工程师：失去它像被截肢
GPT-5.5新模型在代码、知识工作和科学研究领域表现显著提升，效率更高，功能更强。与前代相比，GPT-5.5在编程和文档生成方面展现出更强的自主性和推理...
Yelp Achieves Zero-Downtime Upgrade of Over 1,000 Cassandra Nodes
Yelp has completed a large-scale upgrade of its Apache Cassandra infrastructu...
扒完 DeepSeek V4 报告，我翻出了这个隐藏彩蛋
你的 MLA 是我的基础，我的 Muon 是你的加速器。#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。