小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
英伟达最强B200算力浪费60%!普林斯顿团队出手,利用率升至71%

普林斯顿团队发现英伟达B200 GPU因软硬件不匹配导致60%算力浪费,利用率仅为20%-30%。经过FlashAttention-4算法优化后,利用率提升至71%。该算法通过改进指数运算和内存管理,显著提高计算效率,并将编译速度提升至30倍。

英伟达最强B200算力浪费60%!普林斯顿团队出手,利用率升至71%

量子位
量子位 · 2026-03-18T00:31:26Z
模块化:2026年NVIDIA GTC上的模块化:基于Blackwell的MAX、Mojo内核移植以及B200上的DeepSeek V3

在NVIDIA GTC展会上,我们展示了基于MAX框架的FLUX图像生成和Mojo编程的CUTLASS内核移植。DeepSeek V3在云端运行,提供实时指标,欢迎到3004号展位交流。

模块化:2026年NVIDIA GTC上的模块化:基于Blackwell的MAX、Mojo内核移植以及B200上的DeepSeek V3

Modular Blog
Modular Blog · 2026-03-16T00:00:00Z
加州大学圣地亚哥实验室通过NVIDIA DGX B200系统推动生成式人工智能研究

加州大学圣地亚哥分校的Hao AI实验室获得NVIDIA DGX B200系统,提升了大语言模型推理研究。该系统加速了FastVideo和Lmgame基准,推动低延迟LLM服务的探索。研究人员通过分离预填充和解码任务,优化了系统性能,改善了用户体验。

加州大学圣地亚哥实验室通过NVIDIA DGX B200系统推动生成式人工智能研究

NVIDIA Blog
NVIDIA Blog · 2025-12-17T16:00:15Z

特斯拉Dojo 2芯片即将量产,性能提升10倍,接近英伟达B200,可能实现自研算力,减少对英伟达的依赖。Dojo 2将加速FSD训练,未来还将推出更强的Dojo 3,对汽车行业AI基础设施发展具有重要启示。

老黄一夜被偷家!特斯拉Dojo 2芯片量产倒计时,算力直逼英伟达最强B200

量子位
量子位 · 2025-07-18T00:50:22Z

AMD发布了MI350X和MI355X两款AI芯片,性能超越英伟达B200,推理速度快30%。新芯片采用3nm工艺,内存容量是B200的1.6倍,功耗更低。预计明年推出MI400系列,速度提升可达10倍。

超越英伟达B200!AMD最强AI芯:1.6倍大内存、大模型推理快30%,奥特曼都来站台

量子位
量子位 · 2025-06-13T02:47:32Z
推出全新 Amazon EC2 P6-B200 实例!搭载 NVIDIA Blackwell GPU,加速人工智能创新

AWS推出了支持NVIDIA B200的Amazon EC2 P6-B200实例,专为AI、机器学习和高性能计算设计。该实例配备8个NVIDIA B200 GPU和1440GB内存,性能是P5en实例的两倍,适合大规模AI训练和推理。用户可在美国西部区域预留容量块,并支持与多种AWS服务集成。

推出全新 Amazon EC2 P6-B200 实例!搭载 NVIDIA Blackwell GPU,加速人工智能创新

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-05-19T03:03:21Z
搭载NVIDIA B200的Supermicro系统性能优于上一代系统

Super Micro Computer, Inc.(SMCI)宣布其NVIDIA HGX B200 8-GPU系统在MLPerf Inference v5.0基准测试中表现优异,液冷和风冷系统的性能超过H200系统3倍,新冷却技术显著提升了冷却能力,支持更高密度和性能。

搭载NVIDIA B200的Supermicro系统性能优于上一代系统

全球TMT-美通国际
全球TMT-美通国际 · 2025-04-06T03:08:15Z

在GTC大会上,老黄发布了新AI芯片GB300,其推理性能是GB200的1.5倍,并预览了下一代芯片Vera Rubin。英伟达还推出了DGX Spark和DGX Station两款个人AI超级计算机,支持高效AI运算。同时发布了NVIDIA Dynamo开源库以加速推理,提升性能。大会还探讨了自动驾驶和量子计算等前沿技术。

老黄发布新核弹B300,英伟达:B200已破DeepSeek-R1推理世界纪录

量子位
量子位 · 2025-03-18T22:32:25Z

英伟达5090显卡配备32GB GDDR7内存和21760个CUDA核心,功耗600W,引发对散热和噪音的担忧。相比之下,5080显卡有16GB内存。5090可能采用双芯片封装技术,基于3nm Blackwell架构,支持GDDR7内存,预计2025年后发布,需PCIe 5.0插槽。尽管功耗高,仍被看好在游戏和AI领域的应用潜力。

英伟达5090被曝32G大显存、核心是5080的两倍!网友:怕不是B200双芯封装技术下放

量子位
量子位 · 2024-09-30T00:41:29Z

英伟达推迟了最强芯片B200的发布,推出了阉割版B200A以满足中低端AI系统需求。B200A的内存带宽缩水一半,原因是封装工艺由CoWoS-L退回CoWoS-S。B200训练大模型面临挑战,如耗电、散热、网络设计等。英伟达回应称Hopper需求强劲,Blackwell样品试用已开始,产量有望下半年增加。

英伟达阉割版B200A曝光!最强芯片架构难产:产能不够,刀法来凑

量子位
量子位 · 2024-08-05T06:02:04Z
英伟达发布Blackwell B200 GPU,被称为“全球最强AI芯片”

英伟达推出了Blackwell B200 GPU和GB200超级芯片,提供了更高的性能和能效。B200 GPU提供20 petaflops的FP4算力,而GB200则将两个GPU与一个Grace CPU结合,性能提升30倍。英伟达的目标是拥有更大设计的公司,如GB200 NVL72,提供720 petaflops的AI训练性能。亚马逊、谷歌、微软和甲骨文计划在其云服务中提供NVL72机架。英伟达的系统可以扩展到数万个GB200超级芯片。

英伟达发布Blackwell B200 GPU,被称为“全球最强AI芯片”

The Verge
The Verge · 2024-03-18T20:39:02Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码