💡 原文英文,约1000词,阅读约需4分钟。
📝

内容提要

英伟达的AI平台通过NVIDIA Eos AI超级计算机在MLPerf基准测试中取得了显著进展,训练了基于GPT-3模型的1750亿个参数,仅用了3.9分钟。Eos现在可以在8天内训练完整个GPT-3数据集,比之前最先进的系统快了73倍。这种训练时间的加速降低了成本,节省了能源,并加快了上市时间。

🎯

关键要点

  • 英伟达的AI平台在MLPerf基准测试中取得显著进展,Eos超级计算机训练GPT-3模型仅用3.9分钟。
  • Eos可以在8天内训练完整个GPT-3数据集,比之前的系统快73倍。
  • 训练时间的加速降低了成本,节省了能源,加快了上市时间。
  • 在新的生成AI测试中,1024个NVIDIA Hopper架构GPU在2.5分钟内完成Stable Diffusion模型的训练基准。
  • 最新结果部分归功于使用了历史上最多的加速器,10752个H100 GPU的应用。
  • H100 GPU的数量增加带来了2.8倍的性能提升,效率达到93%。
  • NVIDIA的Eos和Azure在性能上相差不到2%,展示了NVIDIA AI在数据中心和公共云部署中的效率。
  • NVIDIA在多个工作负载中设立了新记录,包括推荐模型和计算机视觉模型的性能提升。
  • HPC基准测试中,H100 GPU的性能是A100 GPU的两倍,显示出自2019年以来的16倍提升。
  • OpenFold模型的训练时间从11天缩短到7.5分钟,帮助加速药物发现过程。
  • MLPerf基准测试自2018年推出以来,得到了广泛的行业和学术支持,确保测试结果的透明性和客观性。
➡️

继续阅读