NVIDIA Blog ·

NVIDIA Hopper在MLPerf生成式AI中领先

💡 原文英文，约900词，阅读约需4分钟。

📝

内容提要

NVIDIA使用TensorRT-LLM软件将Hopper GPU在GPT-J LLM上的性能提升了近3倍。H200 GPU在MLPerf的最大生成AI测试中提供了最快的推理性能。NVIDIA还推出了具有更多内存的H200 GPU和GH200 Superchips。NVIDIA的Hopper GPU在MLPerf的每个AI推理测试中表现出色。NVIDIA展示了结构稀疏性、修剪和DeepCache等创新技术。MLPerf基准测试是透明客观的。

🎯

关键要点

NVIDIA使用TensorRT-LLM软件将Hopper GPU在GPT-J LLM上的性能提升了近3倍。
H200 GPU在MLPerf的最大生成AI测试中提供了最快的推理性能。
NVIDIA推出了具有更多内存的H200 GPU和GH200 Superchips。
H200 GPU在MLPerf的Llama 2基准测试中达到了每秒31,000个token的记录。
H200 GPU配备141GB的HBM3e内存，速度比H100 GPU快43%。
GH200 Superchips结合了Hopper架构GPU和NVIDIA Grace CPU，提供高达624GB的快速内存。
Hopper GPU在最新的MLPerf基准测试中在每个AI推理测试中表现出色。
NVIDIA展示了结构稀疏性、修剪和DeepCache等创新技术，分别提高了推理速度。
MLPerf的测试是透明和客观的，用户可以依赖结果做出明智的购买决策。
NVIDIA的合作伙伴参与MLPerf，以帮助客户评估AI系统和服务。
NVIDIA Blackwell架构GPU将提供支持多万亿参数AI模型所需的新性能。

🏷️

继续阅读

ABB机器人利用NVIDIA Omniverse大规模交付工业级物理AI
ABB与NVIDIA合作，将工业级物理AI引入工厂，通过整合NVIDIA Omniverse库到RobotStudio，实现高精度仿真，降低工程时间和部署...
商业智能分析：AI时代的完整指南
数据智能是现代商业智能的基础，通过学习数据结构和实时反馈提升分析能力。结合复合AI，数据智能高效处理分析工作流，帮助各业务部门快速获取洞察，显著提高企业决...
宣布AI网关工作组
AI网关工作组将在阿姆斯特丹的KubeCon + CloudNativeCon欧洲大会上展示其提案，探讨AI与网络基础设施的交集，并展示初步设计和原型。
[龙虾教程] 自建Sub2API中转站管理多个AI账号方便集中管理/好友共享/快速切换
自建API中转站可集中管理多个账号，如ChatGPT和Claude，简化调度和使用。使用Sub2API程序可实现账号批量管理、自动切换和共享，建议在内网部...
上下文衰退如何影响企业AI和大型语言模型（LLM）的结果，以及如何解决这一问题
上下文衰退影响企业AI和大型语言模型（LLM）的表现。旧数据未被清除，导致信息混乱和推理能力下降。企业需监控关键数据指标，清除过时数据，以提升AI的准确性和效率。
2026年顶尖AI GitHub仓库
AI代理通过SerpApi访问Google搜索，推动智能化发展。GitHub上AI项目激增，OpenClaw等开源项目迅速崛起，支持本地AI助手和工作流自...

NVIDIA Hopper在MLPerf生成式AI中领先

内容提要

关键要点

标签

继续阅读