💡
原文英文,约1000词,阅读约需4分钟。
📝
内容提要
英伟达的AI平台通过NVIDIA Eos AI超级计算机在MLPerf基准测试中取得了显著进展,训练了基于GPT-3模型的1750亿个参数,仅用了3.9分钟。Eos现在可以在8天内训练完整个GPT-3数据集,比之前最先进的系统快了73倍。这种训练时间的加速降低了成本,节省了能源,并加快了上市时间。
🎯
关键要点
- 英伟达的AI平台在MLPerf基准测试中取得显著进展,Eos超级计算机训练GPT-3模型仅用3.9分钟。
- Eos可以在8天内训练完整个GPT-3数据集,比之前的系统快73倍。
- 训练时间的加速降低了成本,节省了能源,加快了上市时间。
- 在新的生成AI测试中,1024个NVIDIA Hopper架构GPU在2.5分钟内完成Stable Diffusion模型的训练基准。
- 最新结果部分归功于使用了历史上最多的加速器,10752个H100 GPU的应用。
- H100 GPU的数量增加带来了2.8倍的性能提升,效率达到93%。
- NVIDIA的Eos和Azure在性能上相差不到2%,展示了NVIDIA AI在数据中心和公共云部署中的效率。
- NVIDIA在多个工作负载中设立了新记录,包括推荐模型和计算机视觉模型的性能提升。
- HPC基准测试中,H100 GPU的性能是A100 GPU的两倍,显示出自2019年以来的16倍提升。
- OpenFold模型的训练时间从11天缩短到7.5分钟,帮助加速药物发现过程。
- MLPerf基准测试自2018年推出以来,得到了广泛的行业和学术支持,确保测试结果的透明性和客观性。
🏷️
标签
➡️