小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Grace Hopper 系统将助力提升 Tumbleweed 的 Armv9 版本构建

Grace Hopper 系统将提升 Tumbleweed 的 Armv9 版本构建,支持高性能计算和人工智能应用。该系统利用 NVIDIA Grace Hopper Superchip 提供超大带宽和计算能力,显著加快编译速度,降低任务延迟,优化开发体验,助力 openSUSE 扩展硬件支持。

Grace Hopper 系统将助力提升 Tumbleweed 的 Armv9 版本构建

openSUSE 中文社区
openSUSE 中文社区 · 2025-06-24T01:30:00Z
Hopper Disassembler for macOS 5.18.1

本文介绍了Hopper Disassembler for macOS 5.18.1的破解版下载信息,包括下载链接和提取码,并对比了试用版与破解版本,强调了破解工具在逆向分析中的重要性。

Hopper Disassembler for macOS 5.18.1

obaby@mars
obaby@mars · 2025-05-15T01:23:08Z
革新AI推理:DeepSeek发布FlashMLA——Hopper GPU的颠覆性加速工具

DeepSeek推出了FlashMLA,这是一个针对NVIDIA Hopper GPU的AI加速工具,优化了多层注意力解码,提升了推理效率。其特点包括动态资源分配和低秩压缩,降低了成本和内存占用。FlashMLA的开源特性使中小企业和研究人员更易构建AI应用,推动可持续发展。

革新AI推理:DeepSeek发布FlashMLA——Hopper GPU的颠覆性加速工具

DEV Community
DEV Community · 2025-02-26T08:49:29Z
DeepSeek开源FlashMLA:Hopper GPU解码新标杆,测评大揭秘!

DeepSeek推出FlashMLA开源项目,结合MLA算法与GPU优化,专为Hopper GPU设计,显著降低延迟并提升推理效率。评测显示,H800 GPU可达3000 GB/s内存速度和580 TFLOPS计算性能,受到vLLM和SGLang框架的关注。

DeepSeek开源FlashMLA:Hopper GPU解码新标杆,测评大揭秘!

机器之心
机器之心 · 2025-02-25T02:09:00Z
Hopper实现新高度,加速主流企业服务器的AI和高性能计算应用

NVIDIA H200 NVL专为低功耗、空气冷却的企业机架设计,提升了语言模型推理和高性能计算的效率,支持灵活配置,适应多种工作负载。结合NVIDIA NVLink技术,显著提高GPU间通信速度,广泛应用于多个行业。多家企业和高校正在利用H200 NVL加速AI和HPC项目。

Hopper实现新高度,加速主流企业服务器的AI和高性能计算应用

NVIDIA Blog
NVIDIA Blog · 2024-11-18T18:30:13Z

本研究针对当前强化学习领域中基准测试选择的缺乏讨论和科学依据的问题,提出了将基准测试视为一门独立科学学科的观点。通过对不同Hopper环境的案例研究,发现基准选择极大影响算法性能评估,研究呼吁建立统一的语言和标准来合理化基准选择的过程。

我们可以普遍地跳跃吗?关于基准选择和设计的讨论,使用Hopper环境

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-11T00:00:00Z
Nvidia的硬件路线图及其对开发者的影响

Nvidia计划每年发布一款新的GPU,直到2027年,重点是混合精度计算。公司旨在使GPU成为操作的必需品,类似于CPU。Nvidia的旗舰GPU Hopper正在为Microsoft、Meta和OpenAI驱动人工智能。然而,下一代GPU Blackwell的发布面临技术挑战。Nvidia还将Python作为其CUDA框架的一等公民,并扩展对其他编程语言的支持。该公司正在致力于更高效的编码,并开发庞大的GPU集群来处理具有数万亿参数的人工智能模型。Nvidia面临来自Intel和AMD的竞争,后者正在开发CUDA的开源替代品。

Nvidia的硬件路线图及其对开发者的影响

The New Stack
The New Stack · 2024-08-12T18:01:06Z

英伟达推迟了最强芯片B200的发布,推出了阉割版B200A以满足中低端AI系统需求。B200A的内存带宽缩水一半,原因是封装工艺由CoWoS-L退回CoWoS-S。B200训练大模型面临挑战,如耗电、散热、网络设计等。英伟达回应称Hopper需求强劲,Blackwell样品试用已开始,产量有望下半年增加。

英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑

量子位
量子位 · 2024-08-05T06:02:04Z
NVIDIA Grace Hopper超级芯片加速Murex MX.3分析性能,降低能耗

法国金融科技公司Murex正在测试NVIDIA Grace Hopper超级芯片,以提高交易和风险平台的计算速度和能源效率。Murex的MX.3平台帮助金融机构进行交易、风险和运营管理。

NVIDIA Grace Hopper超级芯片加速Murex MX.3分析性能,降低能耗

NVIDIA Blog
NVIDIA Blog · 2024-05-31T15:00:58Z
NVIDIA Hopper在MLPerf生成式AI中领先

NVIDIA使用TensorRT-LLM软件将Hopper GPU在GPT-J LLM上的性能提升了近3倍。H200 GPU在MLPerf的最大生成AI测试中提供了最快的推理性能。NVIDIA还推出了具有更多内存的H200 GPU和GH200 Superchips。NVIDIA的Hopper GPU在MLPerf的每个AI推理测试中表现出色。NVIDIA展示了结构稀疏性、修剪和DeepCache等创新技术。MLPerf基准测试是透明客观的。

NVIDIA Hopper在MLPerf生成式AI中领先

NVIDIA Blog
NVIDIA Blog · 2024-03-27T15:40:47Z
机架与滚动:NVIDIA Grace Hopper 系统齐聚GTC

NVIDIA GTC将展示使用NVIDIA GH200 Grace Hopper Superchips的加速系统,展示的500多台服务器将在18个机架上以多种配置展示。这些系统支持AI、高性能计算和NVIDIA Omniverse应用。GH200 Superchips结合了高性能、高效能的Grace CPU和强大的NVIDIA H100 GPU,具有更高的效率和性能。

机架与滚动:NVIDIA Grace Hopper 系统齐聚GTC

NVIDIA Blog
NVIDIA Blog · 2024-02-27T16:00:36Z

本文介绍了FlashAttention-2前向传递的优化实现,使用了自定义融合的CUDA内核,适应NVIDIA Hopper架构,并使用开源的CUTLASS库编写。通过解释在线softmax和连续的GEMM内核融合的挑战和技术,利用Hopper特定的Tensor Memory Accelerator(TMA)和Warpgroup Matrix-Multiply-Accumulate(WGMMA)指令,定义和转换CUTLASS布局和张量,重叠复制和GEMM操作,并选择最优瓦片大小,平衡寄存器压力和共享内存利用率。在单个H100 PCIe GPU上的对比性测试中,与针对上一代NVIDIA Ampere架构进行优化的FlashAttention-2版本相比,FLOPs/s高出20-50%。

CUDA 内核融合研究案例:在 NVIDIA Hopper 架构上使用 CUTLASS 库实现 FlashAttention-2

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-19T00:00:00Z
NVIDIA Grace Hopper 超级芯片为全球研究中心、系统制造商和云提供商的40多台AI超级计算机提供动力

NVIDIA宣布GH200 Grace Hopper超级芯片将在全球范围内投入使用,加速复杂的人工智能和高性能计算应用,为全球科学超级计算中心提供动力。GH200已被100多家企业、组织和政府机构采用,并将通过NVIDIA LaunchPad提供免费访问。

NVIDIA Grace Hopper 超级芯片为全球研究中心、系统制造商和云提供商的40多台AI超级计算机提供动力

NVIDIA Blog
NVIDIA Blog · 2023-11-13T14:00:08Z

为实现万物皆可fuzz,提出解释性模糊测试概念,利用Rust bindgen和宏、特性自动化测试library API,无需人工成本。特点包括自动调用API、生成参数、推断API约束、支持二进制插桩。GitHub链接:[已移除]。

hopper - 自动化library模糊测试工具

Rust.cc
Rust.cc · 2023-11-10T07:56:42Z
英伟达Grace Hopper超级芯片横扫MLPerf推理基准测试

NVIDIA在最新的MLPerf基准测试中表现出色,GH200 Grace Hopper超级芯片在所有数据中心推理测试中表现出色,而HGX H100系统在每个MLPerf推理测试中提供了最高的吞吐量。NVIDIA还宣布了TensorRT-LLM,这是一个优化生成AI软件推理的开源库,以及L4 GPU,可在各方面提供出色的性能。NVIDIA的Jetson Orin系统模块在物体检测方面表现出84%的性能提升。MLPerf基准测试透明客观,有70多个组织支持。NVIDIA基准测试中使用的所有软件都可以从MLPerf存储库中获取。

英伟达Grace Hopper超级芯片横扫MLPerf推理基准测试

NVIDIA Blog
NVIDIA Blog · 2023-09-11T16:00:00Z
旅游颠覆者:将金融科技引入旅行预订

Hopper是一款旅游应用程序,最初依靠航空机票销售获得收入。然而,该公司于2019年开始提供算法驱动的金融产品,如价格冻结和取消保险,以增加盈利能力。这些产品已成为Hopper价值主张的核心部分,近一半的客户将金融产品与交易相关联。Hopper还将社交商务和游戏化融入其应用程序,奖励客户参与。该公司针对年轻人群,并与租车合作伙伴协商,免除年轻驾驶员费用。Hopper Cloud向其他旅游公司提供其金融产品,已成为该公司的重要收入来源。Hopper的成功归因于为未来打造产品,并了解下一代的需求。

旅游颠覆者:将金融科技引入旅行预订

McKinsey Insights & Publications
McKinsey Insights & Publications · 2023-06-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码