老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录

💡 原文中文,约4000字,阅读约需10分钟。
📝

内容提要

在GTC大会上,老黄发布了新AI芯片GB300,其推理性能是GB200的1.5倍,并预览了下一代芯片Vera Rubin。英伟达还推出了DGX Spark和DGX Station两款个人AI超级计算机,支持高效AI运算。同时发布了NVIDIA Dynamo开源库以加速推理,提升性能。大会还探讨了自动驾驶和量子计算等前沿技术。

🎯

关键要点

  • 老黄在GTC大会上发布了新AI芯片GB300,其推理性能是GB200的1.5倍。
  • GB300预计将在今年下半年出货,下一代芯片Vera Rubin将在2026年下半年发货。
  • Vera Rubin的整体性能是GB300的3.3倍,CPU内存和带宽均有显著提升。
  • 英伟达推出了两款个人AI超级计算机:DGX Spark和DGX Station,分别售价3000美元和搭载GB300。
  • DGX Spark是全球最小的个人AI超级计算机,DGX Station则是首个采用GB300的AI电脑。
  • 英伟达推出了Spectrum-X,以太网网络平台,提升AI网络性能1.6倍。
  • 发布了NVIDIA Dynamo开源库,用于加速AI模型推理,提升性能并降低算力消耗。
  • 新推理模型Llama Nemotron基于开源Llama基础模型构建,优化了计算效率和准确性。
  • 英伟达与通用汽车达成合作,发布NVIDIA Halos自动驾驶安全系统。
  • 宣布与Google DeepMind和Disney Research合作开发开源仿真物理模型Newton。
  • GTC大会首次设立“量子日”活动,讨论量子计算的技术现状和未来发展方向。

延伸问答

GB300芯片的推理性能相比GB200提升了多少?

GB300的推理性能是GB200的1.5倍。

Vera Rubin芯片预计何时发布?

Vera Rubin预计将在2026年下半年发布。

DGX Spark和DGX Station的主要区别是什么?

DGX Spark是全球最小的个人AI超级计算机,售价3000美元;而DGX Station是首个采用GB300芯片的AI电脑,性能更强大。

NVIDIA Dynamo开源库的主要功能是什么?

NVIDIA Dynamo用于加速AI模型推理,提升性能并降低算力消耗。

英伟达与通用汽车的合作内容是什么?

英伟达与通用汽车合作发布了NVIDIA Halos自动驾驶安全系统。

GTC大会上讨论了哪些前沿技术?

大会讨论了自动驾驶、量子计算等前沿技术。

➡️

继续阅读