NVIDIA Blog ·

最新数据显示，NVIDIA Blackwell Ultra在代理AI应用中提供高达50倍的性能提升和35倍的成本降低

💡 原文英文，约900词，阅读约需4分钟。

📝

内容提要

微软和Oracle等云服务商正在大规模部署NVIDIA GB300 NVL72系统，以支持低延迟和长上下文的AI应用。NVIDIA Blackwell平台的广泛应用降低了每个token的成本，GB300 NVL72在低延迟和长上下文场景中表现优异，推动了AI编程助手的快速发展。

🎯

关键要点

微软、CoreWeave和Oracle等云服务商正在大规模部署NVIDIA GB300 NVL72系统，以支持低延迟和长上下文的AI应用。
NVIDIA Blackwell平台被广泛采用，降低了每个token的成本，GB300 NVL72在低延迟和长上下文场景中表现优异。
AI代理和编程助手的需求激增，软件编程相关的AI查询从11%增长到约50%。
NVIDIA GB300 NVL72系统在每兆瓦的吞吐量上提高了50倍，成本降低了35倍。
NVIDIA的极端协同设计通过芯片、系统架构和软件创新，加速了AI工作负载的性能。
GB300 NVL72在低延迟工作负载中提供了超过10倍的每瓦token数量，成本显著降低。
NVIDIA TensorRT-LLM等团队的持续优化显著提升了Blackwell NVL72的吞吐量。
GB300 NVL72在长上下文场景中表现优越，成本比GB200 NVL72低1.5倍。
领先的云服务商和AI创新者已经在生产中部署GB300 NVL72，以支持实时推理。
NVIDIA Rubin平台将带来下一代性能，MoE推理的吞吐量提高10倍，成本降低至每百万token的十分之一。

❓

延伸问答

NVIDIA GB300 NVL72系统的主要优势是什么？

NVIDIA GB300 NVL72系统在低延迟和长上下文场景中提供高达50倍的吞吐量提升和35倍的成本降低。

哪些云服务商正在部署NVIDIA的系统？

微软、CoreWeave和Oracle等云服务商正在大规模部署NVIDIA GB300 NVL72系统。

NVIDIA Blackwell平台如何降低每个token的成本？

NVIDIA Blackwell平台通过极端协同设计和软件优化，降低了每个token的成本，最高可达10倍。

AI代理和编程助手的需求增长了多少？

AI代理和编程助手的需求激增，软件编程相关的AI查询从11%增长到约50%。

GB300 NVL72在长上下文场景中的表现如何？

GB300 NVL72在长上下文场景中表现优越，成本比GB200 NVL72低1.5倍。

NVIDIA Rubin平台的预期性能提升是什么？

NVIDIA Rubin平台预计在MoE推理中提供高达10倍的吞吐量提升，并将成本降低至每百万token的十分之一。

🏷️

标签

AI应用 GB300 NVL72 NVIDIA ai blackwell 云服务低延迟性能提升

➡️

继续阅读

NVIDIA、KRAFTON、NC及现任《英雄联盟》冠军T1在韩国PC房庆祝RTX Spark
NVIDIA在韩国推出RTX Spark超芯片，旨在提升Windows PC在个人AI时代的性能。该芯片支持高性能游戏，能够以1440p分辨率和超过100...
NVIDIA-OpenCode-免费模型使用指南
本文介绍了如何获取和配置NVIDIA API密钥，以便在OpenCode中使用NVIDIA模型。步骤包括注册NVIDIA开发者账号、生成API密钥、通过/...
电竞直播的系统架构、核心功能实现与关键优化策略
电竞直播技术要求高，需解决低延迟和画面流畅性问题。RTC技术将延迟降低至200-1000ms，支持60fps高帧率。通过云端混流、SEI数据同步和弹幕互动...
从系统架构到代码实现，完整拆解“主播带货直播”的RTC技术方案
带货直播依赖低延迟音视频技术，以确保主播与观众的互动流畅。关键技术包括AI美颜、CDN分发和弹幕高并发处理，重点在于实时同步与高并发处理。使用ZEGO E...
IPRaft上新：洛杉矶NTT双ISP VPS $4.5/月，流量弹性扩容，支持银联/USDT
IPRaft推出洛杉矶NTT双ISP VPS，月费仅4.5美元，支持流量弹性扩容和多种支付方式，适合跨境电商和流媒体用户，提供高带宽和原生IP，但访问中国大陆时延迟较高。
港股鞋王千百度，一夜完成AI数据公司转型
千百度（1028.HK）收购AI数据服务商本原智数，形成“鞋履+人工智能数据”双主业，旨在提供高质量数据以满足AI行业需求。交易后，本原智数将独立运营，继...