马斯克的Grok-4-fast在推理效率上超越GPT-5,其背后的算法与英伟达的Jet-Nemotron相关。Jet-Nemotron通过PortNAS框架显著降低推理成本,提高速度和准确率,适用于多种模型。这项技术由华人学者主导,可能改变AI行业格局。
研究团队提出Jet-Nemotron,通过后神经架构搜索优化全注意力模型,显著提高生成吞吐量,同时保持或超越准确率,为高效语言模型设计开辟新路径。
NVIDIA发布了Jet-Nemotron模型系列,利用后神经架构搜索技术显著提升了大语言模型的生成吞吐量,达到53.6倍,同时保持或超越准确率。这一创新降低了计算和内存成本,使得边缘设备的大规模部署成为可能,提升了AI应用的经济性和效率。
英伟达韩松团队推出新语言模型Jet-Nemotron,基于后神经架构搜索,生成效率提升53倍,准确率超越多款模型,尤其在数学、常识和编码任务中表现优异,计划开源代码和模型。
完成下面两步后,将自动完成登录并继续当前操作。