小红花·文摘

NVIDIA H100 GPU在CoreWeave的AI云平台上实现Graph500基准测试的破纪录表现

NVIDIA Blog ·

英伟达与谷歌在太空AI算力竞争中加速，英伟达的H100已由Starcloud卫星发射，谷歌计划在2027年发射TPU。同时，中国的之江实验室已发射12颗计算卫星，展现出强大的计算能力，太空AI竞赛愈发激烈。

AI算力大战打到太空！英伟达前脚H100入轨，谷歌TPU后脚上天，中国玩家笑而不语

量子位 ·

美国初创公司计划将英伟达H100加速器发射到太空利用太阳能供电和宇宙低温提高效率

蓝点网 ·

在欧盟推出由NVIDIA HGX H100加速的GPU Droplets

The DigitalOcean Blog ·

硅谷惊变：12万张H100的挽歌

宝玉的分享 ·

遥遥领先的华为升腾384超节点VS英伟达NVL72：FP16算力压H100却逊GB200，三倍功耗换自主可控值不值？

硕鼠的博客站 ·

马斯克重磅发布GROK4：史上最聪明AI大模型横空出世，强化学习碾压GPT-4与Claude，20万张H100显卡大力出奇迹，中美科技差距再度拉大，谁将主导AI未来？

硕鼠的博客站 ·

Tri Dao及其团队推出了QuACK内核库，完全用Python编写，利用CuTe-DSL，无需CUDA代码，在H100上实现33%-50%的加速，专注于内存密集型内核优化，提升GPU性能，受到业界关注。

无需CUDA代码给H100加速33%-50%，Flash Attention作者新作火了

量子位 ·

华为推出的CloudMatrix384架构旨在提升AI数据中心的算力效率，突破传统GPU集群的限制。该架构通过高带宽全对等互连和资源解耦，实现高效灵活的计算，支持动态资源调配，显著降低延迟并提升性能，为AI应用提供更优基础设施解决方案。

华为CloudMatrix重磅论文披露AI数据中心新范式，推理效率超 H100

量子位 ·

Meta发布Llama 4系列，包括Llama 4 Scout和Maverick，采用MoE架构，显著减少参数量，性能超越GPT-4.5。新模型支持百万上下文，具备多模态能力，运行成本低，标志着开源AI新时代。

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

量子位 ·

新加坡”晶盾行动”打击GPU转运网络，DeepSeek的英伟达H100是怎么流入中国的？

硕鼠的博客站 ·

达尔优H100轻量化游戏手柄重155克，设计优雅，适合长时间使用。采用霍尔摇杆和扳机，响应迅速，减轻手指疲劳。支持多设备连接，续航良好，性价比高，适合游戏爱好者。

手柄也讲轻量化？达尔优H100轻量化游戏手柄，不止是轻量！

熊猫不是猫QAQ ·

红杉资本报告称，AI产业需年产值超6000亿美元才能支付基础设施费用。OpenAI等公司在训练和推理上的支出超过收入，预计2026年亏损140亿美元。NVIDIA新芯片供不应求，GPU市场竞争激烈，H100算力供过于求，价格下降。市场趋势显示开放模型兴起，小型模型减少，算力需求下降。建议租用算力以避免投资亏损。

2美元/小时出租H100：GPU泡沫破灭前夜

OneFlow深度学习框架 ·

DigitalOcean Kubernetes（DOKS）现已支持H100 GPU工作节点

The DigitalOcean Blog ·

微调大模型，AMD MI300X就够了！跟着这篇博客微调Llama 3.1 405B，效果媲美H100

机器之心 ·

AWS 宣布 EC2 P5e 实例正式上线，搭载 NVIDIA H100 Tensor Core GPU

InfoQ ·

本研究解决了启用可信执行环境（TEE）对NVIDIA H100 GPU在大型语言模型（LLM）推理任务中性能的影响。研究表明，尽管GPU内部的计算开销较小，但总体性能罚款主要来自于通过PCIe的数据传输；绝大多数典型LLM查询的开销保持在5%以下。

在nVIDIA H100 GPU上的保密计算：性能基准研究

BriefGPT - AI 论文速递 ·

真我手机发布真我13 Pro，搭载天玑7300处理器，120Hz高刷新率直屏，5000mAh电池，支持80W闪充。铂傲推出Beoplay H100头戴式耳机，模块化设计，定价11598元。淘宝减免卖家直播软件服务费1年。《星鸣特攻》下线停售，已购买游戏玩家可退款。Intel取消Beast Lake处理器及后续产品线，重心放在GPU方面。少数派推出PiPods真无线耳机特卖，只需199元。

派早报：真我 13 Pro、Beoplay H100 头戴式耳机等新品发布

少数派 ·

DigitalOcean Kubernetes 现已支持 Nvidia H100（早期访问）

The DigitalOcean Blog ·

Llama 3.1，一个大规模的AI训练模型，在预训练期间频繁出现故障，其中58.7%的问题与GPU有关。团队使用了PyTorch的NCCL飞行记录器等工具来诊断和解决问题。环境因素，如温度波动，也影响了训练性能。随着Meta计划扩展Llama模型，维护一个大型AI集群将是一个挑战。构建和管理这样的集群是复杂的。

Llama3.1训练平均3小时故障一次，H100万卡集群好脆弱，气温波动都会影响吞吐量

量子位 ·

NVIDIA H100 GPU在CoreWeave的AI云平台上实现Graph500基准测试的破纪录表现

AI算力大战打到太空！英伟达前脚H100入轨，谷歌TPU后脚上天，中国玩家笑而不语

美国初创公司计划将英伟达H100加速器发射到太空 利用太阳能供电和宇宙低温提高效率

在欧盟推出由NVIDIA HGX H100加速的GPU Droplets

硅谷惊变：12万张H100的挽歌

遥遥领先的华为升腾384超节点VS英伟达NVL72：FP16算力压H100却逊GB200，三倍功耗换自主可控值不值？

马斯克重磅发布GROK4：史上最聪明AI大模型横空出世，强化学习碾压GPT-4与Claude，20万张H100显卡大力出奇迹，中美科技差距再度拉大，谁将主导AI未来？

无需CUDA代码给H100加速33%-50%，Flash Attention作者新作火了

华为CloudMatrix重磅论文披露AI数据中心新范式，推理效率超 H100

LIama 4发布重夺开源第一！DeepSeek同等代码能力但参数减一半，一张H100就能跑，还有两万亿参数超大杯

新加坡”晶盾行动”打击GPU转运网络，DeepSeek的英伟达H100是怎么流入中国的？

手柄也讲轻量化？达尔优H100轻量化游戏手柄，不止是轻量！

2美元/小时出租H100：GPU泡沫破灭前夜

DigitalOcean Kubernetes（DOKS）现已支持H100 GPU工作节点

微调大模型，AMD MI300X就够了！跟着这篇博客微调Llama 3.1 405B，效果媲美H100

AWS 宣布 EC2 P5e 实例正式上线，搭载 NVIDIA H100 Tensor Core GPU

在nVIDIA H100 GPU上的保密计算：性能基准研究

派早报：真我 13 Pro、Beoplay H100 头戴式耳机等新品发布

DigitalOcean Kubernetes 现已支持 Nvidia H100（早期访问）

Llama3.1训练平均3小时故障一次，H100万卡集群好脆弱，气温波动都会影响吞吐量

美国初创公司计划将英伟达H100加速器发射到太空利用太阳能供电和宇宙低温提高效率