量子位 ·

英伟达开源9B参数小模型，比Qwen3快6倍

💡 原文中文，约3300字，阅读约需8分钟。

📝

内容提要

英伟达推出了新型小型语言模型Nemotron Nano v2，参数为90亿，速度比Qwen3快6倍，准确率相当。该模型在20万亿token上预训练，并开源大部分数据集，支持复杂推理和思考预算控制。

🎯

关键要点

英伟达推出新型小型语言模型Nemotron Nano v2，参数为90亿。
Nemotron Nano v2在复杂推理基准测试上的准确率与Qwen3-8B相当或更高，速度快6倍。
模型在20万亿token上进行预训练，并开源大部分数据集。
模型支持复杂推理和思考预算控制，用户可指定模型思考的token数量。
Nemotron Nano v2经过预训练和后训练，使用多种优化技术提升性能。
英伟达发布了66万亿token的预训练数据集，包含多种类型的数据。
Nemotron-Pre-Training-Dataset-v1分为四个类别，涵盖网络爬取、数学、代码等数据。
英伟达的开源策略与其他科技巨头形成对比，积极推动开源生态。

🏷️

继续阅读

2025年全年独立显卡出货量达4,428万张但我怀疑不少是买来训练/跑模型的
预计2025年台式机独立显卡出货量将达4428万张，英伟达占92%。尽管RTX 50系列显卡因性能强大而受欢迎，但因内存短缺价格高企，开发者和小企业需求增...
本月DSF成员 - Theresa Seyram Agbenyegah
我叫Theresa Seyram Agbenyegah，社区称我为Stancy；我是一名后端工程师、社会企业家和开源倡导者，致力于利用技术创造积极影响，拥...
.NET 9 + AOT 打造跨平台批量图像转换工具
该项目是一个基于.NET 9的开源C#图像处理工具，支持格式转换、尺寸调整和智能压缩，具备零依赖、跨平台和高性能特点，适用于桌面和Web应用。
像OpenCode、Cline和Aider这样的开源编码代理正在为开发者解决一个巨大的难题
越来越多的开放项目在探索开放代理架构，如OpenCode和Kilo Code等工具引入付费层以覆盖基础设施成本。Cline是一个来自2024年Anthro...
那个让马斯克点赞的男人，为什么还是离开了阿里？ - 蝈蝈俊
林俊旸于3月4日辞职，标志着中国AI界的重大变革。他的离开反映了开源与商业之间的矛盾，以及技术理想与管理体制的冲突。作为Qwen的核心人物，他推动了该模型...
别再把 AI 当聊天框了,OpenCowork 让它真正「会干活」
OpenCowork 是一个开源桌面 AI 工作站，旨在整合 AI 工具以提升团队生产力。它支持本地工作流、团队协作和任务自动化，解决了 AI 在日常工作...

英伟达开源9B参数小模型，比Qwen3快6倍

内容提要

关键要点

标签

继续阅读