小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
NVIDIA在MLPerf Training v5.1基准测试中获胜

在AI推理时代,训练更智能的模型至关重要。NVIDIA在MLPerf Training v5.1中表现卓越,所有七项测试均获胜,展示了其Blackwell Ultra架构的强大性能。通过使用NVFP4精度,NVIDIA显著提升了计算性能,Llama 3.1 405B的训练时间创下10分钟新纪录,推动AI智能快速发展。

NVIDIA在MLPerf Training v5.1基准测试中获胜

NVIDIA Blog
NVIDIA Blog · 2025-11-12T16:00:35Z
NVIDIA Blackwell Ultra在新的MLPerf推理基准测试中树立了标杆

NVIDIA GB300 NVL72系统在推理基准测试中表现优异,提升了AI工厂的吞吐量并降低了总拥有成本。新架构Blackwell Ultra提供更强的计算能力和内存,优化大型语言模型推理,显著提升性能。

NVIDIA Blackwell Ultra在新的MLPerf推理基准测试中树立了标杆

NVIDIA Blog
NVIDIA Blog · 2025-09-09T15:00:44Z
NVIDIA Blackwell在最新的MLPerf训练结果中实现突破性性能

NVIDIA与全球企业合作建设AI工厂,提升下一代AI应用的训练和部署效率。其Blackwell架构在MLPerf训练中表现优异,支持多种AI工作负载。通过Tyche和Nyx超级计算机,Blackwell在Llama 3.1基准测试中实现2.2倍性能提升,推动AI经济发展。

NVIDIA Blackwell在最新的MLPerf训练结果中实现突破性性能

NVIDIA Blog
NVIDIA Blog · 2025-06-04T15:00:43Z
速度之王:NVIDIA Blackwell在最新的MLPerf推理结果中夺得领先地位

NVIDIA的GB200 NVL72系统在AI工厂中显著提升了盈利能力,尤其在复杂模型处理方面表现优异。最新的MLPerf Inference V5.0基准测试显示,NVIDIA Blackwell平台在AI推理中创下新纪录。AI工厂通过实时数据转化提供快速、低成本的准确答案,随着模型参数增加,计算需求上升,推动技术创新。

速度之王:NVIDIA Blackwell在最新的MLPerf推理结果中夺得领先地位

NVIDIA Blog
NVIDIA Blog · 2025-04-02T15:00:33Z
巅峰训练:Blackwell 提供下一水平的 MLPerf 训练性能

NVIDIA Blackwell在MLPerf测试中表现优异,AI应用训练性能提升,尤其在大语言模型基准上,GPU性能提高2.2倍。新架构优化了Tensor Cores的使用,实现了更少GPU下的更高性能。Hopper平台持续保持记录,显示出NVIDIA在加速计算平台上的优化及合作伙伴支持。

巅峰训练:Blackwell 提供下一水平的 MLPerf 训练性能

NVIDIA Blog
NVIDIA Blog · 2024-11-13T16:00:01Z
NVIDIA Blackwell 在 MLPerf 推理首秀中为生成式 AI 树立新标准

NVIDIA的Blackwell GPU在Llama 2 70B上提供了高达4倍的性能,Hopper架构在AI基准测试中取得了进展。Blackwell平台使用了第二代Transformer引擎和FP4张量核心,以提高性能。多GPU计算对于满足大型语言模型(LLMs)的实时延迟要求是必要的。NVIDIA合作伙伴也提交了可靠的MLPerf推理结果。NVIDIA平台,包括Hopper架构、Jetson平台和Triton推理服务器,在性能上取得了显著的提升。Jetson AGX Orin在GPT-J LLM工作负载上实现了吞吐量和延迟的改进。NVIDIA平台在数据中心和边缘展示了多样性和领先的性能。

NVIDIA Blackwell 在 MLPerf 推理首秀中为生成式 AI 树立新标准

NVIDIA Blog
NVIDIA Blog · 2024-08-28T15:00:11Z

本文介绍了机器学习在现实世界应用中的重要性,探讨了MLOps的兴起及其在解决模型部署和性能监控等挑战方面的重要性。通过回顾MLOps的演变和其与传统软件开发方法的关系,论文提出了将该系统与机器学习相结合以解决现有MLOps面临的问题并提高生产力的方法。本文重点关注自动化模型训练的重要性,以及通过版本控制系统确保训练过程的透明性和可重复性的方法。此外,还讨论了将机器学习组件集成到传统CI/CD流水线中面临的挑战,并提出了版本环境和容器化等解决方案。最后,论文强调了模型部署后持续监控和反馈循环的重要性,以保持模型的性能和可靠性。本文运用Netflix的案例研究和最佳实践,提出了成功实施MLOps实践的关键策略和经验教训,并为其他组织构建和优化自己的MLOps实践提供了有价值的参考。

通过集体智慧、虚拟化 MLOps、MLPerf、集体知识游乐场和可重现的优化竞赛,实现更高效和经济性的人工智能 / 机器学习系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-24T00:00:00Z
突破新高度:NVIDIA MLPerf Training 结果展示前所未有的性能与弹性

NVIDIA在MLPerf Training v4.0基准测试中取得了出色的性能,与去年相比,在大型语言模型(LLM)基准测试中性能提高了三倍。AI超级计算机配备了11,616个NVIDIA H100 Tensor Core GPU和NVIDIA Quantum-2 InfiniBand网络,为此做出了贡献。NVIDIA H200 Tensor GPU的性能也提高了最多47%。软件优化和增强进一步提升了性能。NVIDIA在LLM微调和加速稳定扩散v2训练方面表现出色。NVIDIA平台得到了10个合作伙伴的广泛生态系统支持。MLCommons的基准测试对于AI计算至关重要。NVIDIA的Blackwell平台承诺提供下一级别的AI性能。

突破新高度:NVIDIA MLPerf Training 结果展示前所未有的性能与弹性

NVIDIA Blog
NVIDIA Blog · 2024-06-12T15:00:30Z
NVIDIA Hopper在MLPerf生成式AI中领先

NVIDIA使用TensorRT-LLM软件将Hopper GPU在GPT-J LLM上的性能提升了近3倍。H200 GPU在MLPerf的最大生成AI测试中提供了最快的推理性能。NVIDIA还推出了具有更多内存的H200 GPU和GH200 Superchips。NVIDIA的Hopper GPU在MLPerf的每个AI推理测试中表现出色。NVIDIA展示了结构稀疏性、修剪和DeepCache等创新技术。MLPerf基准测试是透明客观的。

NVIDIA Hopper在MLPerf生成式AI中领先

NVIDIA Blog
NVIDIA Blog · 2024-03-27T15:40:47Z
在MLPerf基准测试中表现卓越:英伟达加速生成式AI训练

英伟达的AI平台通过NVIDIA Eos AI超级计算机在MLPerf基准测试中取得了显著进展,训练了基于GPT-3模型的1750亿个参数,仅用了3.9分钟。Eos现在可以在8天内训练完整个GPT-3数据集,比之前最先进的系统快了73倍。这种训练时间的加速降低了成本,节省了能源,并加快了上市时间。

在MLPerf基准测试中表现卓越:英伟达加速生成式AI训练

NVIDIA Blog
NVIDIA Blog · 2023-11-08T17:00:10Z
在MLPerf基准测试中表现卓越:NVIDIA加速生成式AI训练

NVIDIA的AI平台在最新的MLPerf行业基准测试中提高了AI训练和高性能计算的标准。NVIDIA Eos超级计算机使用10,752个NVIDIA H100 Tensor Core GPU,在3.9分钟内完成了基于GPT-3模型的训练基准测试。这比六个月前的记录快了近3倍。此外,NVIDIA在其他AI工作负载中也创下了新记录,包括使用H100 GPU在推荐模型训练和RetinaNet计算视觉模型中的性能提升。NVIDIA的全栈平台创新在硬件加速器、系统和软件方面均有贡献。

在MLPerf基准测试中表现卓越:NVIDIA加速生成式AI训练

NVIDIA Blog
NVIDIA Blog · 2023-11-08T17:00:10Z
英伟达Grace Hopper超级芯片横扫MLPerf推理基准测试

NVIDIA在最新的MLPerf基准测试中表现出色,GH200 Grace Hopper超级芯片在所有数据中心推理测试中表现出色,而HGX H100系统在每个MLPerf推理测试中提供了最高的吞吐量。NVIDIA还宣布了TensorRT-LLM,这是一个优化生成AI软件推理的开源库,以及L4 GPU,可在各方面提供出色的性能。NVIDIA的Jetson Orin系统模块在物体检测方面表现出84%的性能提升。MLPerf基准测试透明客观,有70多个组织支持。NVIDIA基准测试中使用的所有软件都可以从MLPerf存储库中获取。

英伟达Grace Hopper超级芯片横扫MLPerf推理基准测试

NVIDIA Blog
NVIDIA Blog · 2023-09-11T16:00:00Z
NVIDIA H100 GPU在首个MLPerf基准测试中为生成式AI设立新标准

NVIDIA的H100 Tensor Core GPU在AI性能方面表现出色,特别在生成式AI的大型语言模型上。H100 GPU在最新的MLPerf训练基准测试中刷新了所有八个测试的记录,特别在生成式AI的新MLPerf测试中表现出色。Inflection AI利用H100 GPU构建了其首个个人AI“Pi”,该AI是基于先进的LLM开发的。CoreWeave计划与Inflection AI合作,利用NVIDIA GPU构建全球最大的计算集群之一。H100 GPU在MLPerf基准测试中表现出的性能得到了用户体验的验证,包括大型语言模型、推荐系统、计算机视觉、医学成像和语音识别等方面。CoreWeave使用的低延迟网络使其从云端提供的性能与NVIDIA在本地数据中心运行的AI超级计算机相当。NVIDIA是唯一提交了增强基准测试结果的公司,展示了其在机器学习领域的广泛生态系统支持。

NVIDIA H100 GPU在首个MLPerf基准测试中为生成式AI设立新标准

NVIDIA Blog
NVIDIA Blog · 2023-06-27T16:00:55Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码