在DeepSeek之后,NVIDIA在GTC大会上将重点放在推理上

在DeepSeek之后,NVIDIA在GTC大会上将重点放在推理上

💡 原文英文,约800词,阅读约需3分钟。
📝

内容提要

今年,DeepSeek开发的高效推理模型导致NVIDIA股价下跌。CEO黄仁勋在GTC大会上强调未来应用将依赖AI,预计AI计算需求将增长100倍,并推出新硬件和软件,助力企业建立“AI工厂”。此外,NVIDIA还发布了优化推理速度的新模型Llama Nemotron。

🎯

关键要点

  • DeepSeek开发的高效推理模型导致NVIDIA股价下跌,分析师担心大规模AI硬件投资时代结束。
  • NVIDIA CEO黄仁勋在GTC大会上宣布新硬件和软件,强调未来应用将依赖AI,预计AI计算需求将增长100倍。
  • 黄仁勋比较了Meta的传统Llama模型与DeepSeek R1,DeepSeek使用了150倍的计算资源,生成了20倍的tokens。
  • 黄仁勋指出,推理规模的计算是极端计算,生成的tokens数量将持续增加。
  • NVIDIA正在经历从手动编码软件到基于加速器和GPU的机器学习软件的转变,未来软件开发需要资本投资。
  • NVIDIA推出了DGX Spark和DGX Station,为开发者提供新的计算平台。
  • NVIDIA发布了新的加速器系列,包括Blackwell Ultra和即将推出的Vera Rubin等,显著提高计算性能和内存带宽。
  • NVIDIA计划每年推出新一代芯片,并随后推出优化版本,黄仁勋自嘲为“收入的首席破坏者”。
  • NVIDIA宣布Dynamo项目,旨在加速和扩展AI工厂中的推理模型。
  • NVIDIA推出了新的推理模型Llama Nemotron,优化了推理速度,并在准确性上提高了20%。
  • 今年GTC大会的反应较为平淡,部分原因是宣布的内容较少,或技术上令人印象深刻但较为晦涩。

延伸问答

DeepSeek的推理模型对NVIDIA股价有什么影响?

DeepSeek开发的高效推理模型导致NVIDIA股价下跌,分析师担心大规模AI硬件投资时代结束。

NVIDIA在GTC大会上发布了哪些新硬件和软件?

NVIDIA在GTC大会上发布了DGX Spark和DGX Station等新硬件,以及新的推理模型Llama Nemotron。

NVIDIA CEO黄仁勋对未来AI计算需求的预测是什么?

黄仁勋预计未来AI计算需求将增长100倍。

NVIDIA的Dynamo项目有什么目标?

Dynamo项目旨在加速和扩展AI工厂中的推理模型,提供优化的框架。

NVIDIA的新推理模型Llama Nemotron有什么特点?

Llama Nemotron优化了推理速度,并在准确性上提高了20%。

NVIDIA在推理计算方面的战略是什么?

NVIDIA强调推理规模的计算是极端计算,并计划每年推出新一代芯片以满足需求。

➡️

继续阅读