NVIDIA在MLPerf Training v5.1基准测试中获胜

NVIDIA在MLPerf Training v5.1基准测试中获胜

💡 原文英文,约800词,阅读约需3分钟。
📝

内容提要

在AI推理时代,训练更智能的模型至关重要。NVIDIA在MLPerf Training v5.1中表现卓越,所有七项测试均获胜,展示了其Blackwell Ultra架构的强大性能。通过使用NVFP4精度,NVIDIA显著提升了计算性能,Llama 3.1 405B的训练时间创下10分钟新纪录,推动AI智能快速发展。

🎯

关键要点

  • 在AI推理时代,训练更智能的模型至关重要。
  • NVIDIA在MLPerf Training v5.1中表现卓越,所有七项测试均获胜。
  • NVIDIA Blackwell Ultra架构在训练性能上显著提升,Llama 3.1 405B的训练时间创下10分钟新纪录。
  • NVIDIA是唯一在所有测试中提交结果的平台,展示了其GPU的丰富可编程性和CUDA软件栈的成熟性。
  • GB300 NVL72系统基于Blackwell Ultra架构,提供超过4倍的Llama 3.1 405B预训练性能。
  • NVFP4精度的使用是本轮出色结果的关键,NVIDIA在训练过程中采用了FP4精度。
  • NVIDIA在本轮中以2560个Blackwell GPU实现了18.79分钟的训练时间,比上轮快45%。
  • NVIDIA在新增的Llama 3.1 8B和FLUX.1基准测试中也创下了新纪录。
  • NVIDIA生态系统参与广泛,15个组织提交了引人注目的结果。
  • NVIDIA以一年为周期进行创新,推动预训练、后训练和推理的显著性能提升。
➡️

继续阅读