InfoQ ·

NVIDIA的GB200 NVL72超级计算机在DeepSeek V2上实现2.7倍更快的推理

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

SGLang与NVIDIA合作发布了GB200 NVL72系统的初步基准测试，LLM推理吞吐量提升2.7倍。优化措施包括FP8矩阵乘法和加速注意力内核，增强了多GPU性能。该系统适用于大规模AI训练和推理，未来将进一步优化预填充延迟和内存利用率。

🎯

❓

GB200 NVL72系统的推理吞吐量提升了2.7倍。

主要优化措施包括FP8矩阵乘法、加速注意力内核和高速度的NVLink令牌路由。

DeepSeek-V2模型的参数数量为6710亿。

该系统适用于大规模AI训练和推理，包括技术文档摘要和企业级检索增强生成。

每个GPU的解码速度为每秒7583个token。

未来的工作将集中在优化预填充延迟和提高内存利用率及延迟方面。

🏷️

SUSE与Nvidia联合推出一款交钥匙AI工厂，专为主权企业工作负载设计
SUSE在布拉格的SUSECON 2026上推出了与Nvidia合作的SUSE AI Factory，这是一个自动化的AI平台，旨在帮助企业和政府构建、部...
大规模自主AI：Adobe代理与NVIDIA和WPP解锁突破性的创意智能
Adobe与NVIDIA和WPP合作，推动自主AI在创意营销中的应用。品牌通过智能系统快速生成个性化内容，提升客户体验。NVIDIA的OpenShell运...
NVIDIA及其合作伙伴在2026汉诺威博览会上展示AI驱动的制造未来
在2026汉诺威博览会上，NVIDIA及其合作伙伴展示了AI驱动的制造未来。随着工业系统复杂性增加，AI物理学和智能代理正在变革设计与测试。数字双胞胎和A...
梁文锋不在乎赢，DeepSeek不能输
上周末，外媒The Information爆出消息：DeepSeek正在寻求至少3亿美元（约20亿人民币）的首轮外部融资，估值至少100亿美元。DeepS...
海信推出新一代旗舰产品，全面提升球迷世界杯观赛体验
（全球TMT2026年4月21日讯）海信4月21日正式启动2026年国际足联世界杯（FIFA World Cu […]
苹果体育现可通过CarPlay小部件实时跟踪比分
苹果体育应用在iOS 26版本中更新了CarPlay小部件，用户可以实时跟踪喜欢的球队或联赛的比分。新小部件界面简洁，支持显示比赛时间和天气等信息。此外，...