最新数据显示，NVIDIA Blackwell Ultra在代理AI应用中提供高达50倍的性能提升和35倍的成本降低

NVIDIA Blog ·

最新数据显示，NVIDIA Blackwell Ultra在代理AI应用中提供高达50倍的性能提升和35倍的成本降低

💡 原文英文，约900词，阅读约需4分钟。

📝

内容提要

微软和Oracle等云服务商正在大规模部署NVIDIA GB300 NVL72系统，以支持低延迟和长上下文的AI应用。NVIDIA Blackwell平台的广泛应用降低了每个token的成本，GB300 NVL72在低延迟和长上下文场景中表现优异，推动了AI编程助手的快速发展。

🎯

关键要点

微软、CoreWeave和Oracle等云服务商正在大规模部署NVIDIA GB300 NVL72系统，以支持低延迟和长上下文的AI应用。
NVIDIA Blackwell平台被广泛采用，降低了每个token的成本，GB300 NVL72在低延迟和长上下文场景中表现优异。
AI代理和编程助手的需求激增，软件编程相关的AI查询从11%增长到约50%。
NVIDIA GB300 NVL72系统在每兆瓦的吞吐量上提高了50倍，成本降低了35倍。
NVIDIA的极端协同设计通过芯片、系统架构和软件创新，加速了AI工作负载的性能。
GB300 NVL72在低延迟工作负载中提供了超过10倍的每瓦token数量，成本显著降低。
NVIDIA TensorRT-LLM等团队的持续优化显著提升了Blackwell NVL72的吞吐量。
GB300 NVL72在长上下文场景中表现优越，成本比GB200 NVL72低1.5倍。
领先的云服务商和AI创新者已经在生产中部署GB300 NVL72，以支持实时推理。
NVIDIA Rubin平台将带来下一代性能，MoE推理的吞吐量提高10倍，成本降低至每百万token的十分之一。

🏷️

继续阅读

将AI应用从原型转向生产需要企业级Postgres基础设施
AI应用在数据库限制、集成复杂性和合规性方面面临挑战，尤其在金融和医疗等受监管行业。pgEdge推出企业级Postgres基础设施，以支持AI应用的安全性...
首个物理AI数据基座平台“无垠”落户浙江，专治机器人数据荒，家庭工业商业场景全覆盖
浙江推出首个物理AI数据基座平台“无垠”，旨在解决机器人数据短缺问题。该平台结合真实数据与虚拟仿真，提供高质量数据，支持具身智能的训练与应用，推动行业发展。
Snowflake Cortex Code CLI 增加对 dbt 和 Apache Airflow 的支持，以实现 AI 驱动的数据管道
Snowflake推出了新的自助月订阅模式，允许任何人（包括非客户）访问编码代理，适用于开发、数据工程及前台工作负载，如销售和商业智能应用。
高中生AI创业，现在只招龙虾员工：每月成本2800
一名高中生创业，利用AI和龙虾员工运营公司，每月成本仅400美元，已吸引450+付费用户。公司结构完整，龙虾负责设计、开发和内容等任务，通过提示词与AI高效协作。
Mermaid+AI，告别“手搓”画流程图
本文提出了一种基于VMD-BiLSTM的电力负荷预测模型，通过变分模态分解提高预测精度。VMD将负荷数据分解为平稳成分，BiLSTM进行时序建模，最终合成...
2026年人们利用AI赚钱的7种方式
越来越多的人利用代理AI工具自动化工作并创造收入。到2026年，个人可通过小型系统轻松开展自由职业，常见收入模式包括工作流自动化、微型SaaS和AI辅助写...

最新数据显示，NVIDIA Blackwell Ultra在代理AI应用中提供高达50倍的性能提升和35倍的成本降低

内容提要

关键要点

标签

继续阅读