老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录
💡
原文中文,约4000字,阅读约需10分钟。
📝
内容提要
在GTC大会上,老黄发布了新AI芯片GB300,其推理性能是GB200的1.5倍,并预览了下一代芯片Vera Rubin。英伟达还推出了DGX Spark和DGX Station两款个人AI超级计算机,支持高效AI运算。同时发布了NVIDIA Dynamo开源库以加速推理,提升性能。大会还探讨了自动驾驶和量子计算等前沿技术。
🎯
关键要点
- 老黄在GTC大会上发布了新AI芯片GB300,其推理性能是GB200的1.5倍。
- GB300预计将在今年下半年出货,下一代芯片Vera Rubin将在2026年下半年发货。
- Vera Rubin的整体性能是GB300的3.3倍,CPU内存和带宽均有显著提升。
- 英伟达推出了两款个人AI超级计算机:DGX Spark和DGX Station,分别售价3000美元和搭载GB300。
- DGX Spark是全球最小的个人AI超级计算机,DGX Station则是首个采用GB300的AI电脑。
- 英伟达推出了Spectrum-X,以太网网络平台,提升AI网络性能1.6倍。
- 发布了NVIDIA Dynamo开源库,用于加速AI模型推理,提升性能并降低算力消耗。
- 新推理模型Llama Nemotron基于开源Llama基础模型构建,优化了计算效率和准确性。
- 英伟达与通用汽车达成合作,发布NVIDIA Halos自动驾驶安全系统。
- 宣布与Google DeepMind和Disney Research合作开发开源仿真物理模型Newton。
- GTC大会首次设立“量子日”活动,讨论量子计算的技术现状和未来发展方向。
❓
延伸问答
GB300芯片的推理性能相比GB200提升了多少?
GB300的推理性能是GB200的1.5倍。
Vera Rubin芯片预计何时发布?
Vera Rubin预计将在2026年下半年发布。
DGX Spark和DGX Station的主要区别是什么?
DGX Spark是全球最小的个人AI超级计算机,售价3000美元;而DGX Station是首个采用GB300芯片的AI电脑,性能更强大。
NVIDIA Dynamo开源库的主要功能是什么?
NVIDIA Dynamo用于加速AI模型推理,提升性能并降低算力消耗。
英伟达与通用汽车的合作内容是什么?
英伟达与通用汽车合作发布了NVIDIA Halos自动驾驶安全系统。
GTC大会上讨论了哪些前沿技术?
大会讨论了自动驾驶、量子计算等前沿技术。
➡️