量子位 ·

英伟达韩松团队新作：具有后神经架构搜索的高效语言模型

💡 原文中文，约3300字，阅读约需8分钟。

📝

内容提要

英伟达韩松团队推出新语言模型Jet-Nemotron，基于后神经架构搜索，生成效率提升53倍，准确率超越多款模型，尤其在数学、常识和编码任务中表现优异，计划开源代码和模型。

🎯

❓

Jet-Nemotron模型基于后神经架构搜索，生成效率提升53倍，准确率超越多款模型，尤其在数学、常识和编码任务中表现优异。

Jet-Nemotron-2B在数学任务上取得了49.6的平均准确率，比Qwen3-1.7B-Base高6.3，同时速度快47倍。

Jet-Nemotron通过四个步骤优化后神经架构搜索，包括全注意力层的放置、选择线性注意力模块、设计新型注意力模块和执行硬件感知架构搜索。

研究团队计划在GitHub上开源代码和模型，目前正等待法律合规审核。

Jet-Nemotron在生成吞吐量和准确率上均优于多款模型，尤其在数学和常识推理任务中表现突出。

研究团队全为华人，成员具有丰富的学术背景和研究经验，主要来自清华大学和麻省理工学院。

🏷️

使用AI Max调整您的购物广告活动以适应现代搜索
谷歌推出了AI Max for Shopping，旨在帮助零售商提升购物广告策略。该工具利用商户中心的数据，用户可一键升级，保留现有的产品定位和出价灵活性...
在关键时刻通过旅行搜索广告与旅行者相遇
搜索广告活动整合旅行信息和格式，简化工作流程，提供统一的性能视图。升级到旅行搜索广告后，用户可享受先进的广告管理、AI出价和报告功能。
开源社区“内战”爆发：Bun 创始人预言“未来将禁止人类贡献”，硅谷大佬纷纷站队！
本文永久链接 – https://tonybai.com/2026/05/01/open-source-civil-war-bun-founder-pre...
在Kubernetes中管理Valkey集群
Over the last several years, Percona has introduced several rock-star Kuberne...
The craziest part of Musk v. Altman happened while the jury was out of the room
Okay, I am not a lawyer so I only understood about half of what just happened...
网友吐槽：OpenClaw又触发了Claude Code当场翻脸还扣钱！
有趣的是，如果你最近的提交中在 JSON 数据块里提到了 OpenClaw，Claude Code 要么会拒绝你的请求，要么会额外收费。一句“openc...