量子位 ·

英伟达最强B200算力浪费60%！普林斯顿团队出手，利用率升至71%

💡 原文中文，约2300字，阅读约需6分钟。

📝

内容提要

普林斯顿团队发现英伟达B200 GPU因软硬件不匹配导致60%算力浪费，利用率仅为20%-30%。经过FlashAttention-4算法优化后，利用率提升至71%。该算法通过改进指数运算和内存管理，显著提高计算效率，并将编译速度提升至30倍。

🎯

🏷️

Beats与Nike联合推出特别版Powerbeats Pro 2
Beats与Nike合作推出Nike特别版Powerbeats Pro 2耳机，右耳镌刻Nike标志，左耳为Beats标志。耳机具备主动降噪和心率监测功能...
AI 救狗争议：基因测序、mRNA 疫苗与伦理审批
“AI救狗”事件引发关注，但真正救狗的是科学家和狗主人的努力。狗主保罗通过AI学习和基因测序，研发出mRNA疫苗。尽管AI提供信息，关键在于保罗的资源和社...
2026 03 18 HackerNews
Kagi Translate 现已支持将内容转换为 LinkedIn 职场话术，用户可轻松翻译多种语言。该工具界面友好，适合快速翻译。评论指出现代商业语言...
20260316
昨晚音乐会后，我的早睡计划失败，今天感到疲惫。AI时代让人沉迷信息，我希望能清空与AI相关的记忆。下午使用Codex生成数据看板，效率大增。晚上继续欣赏舒...
早报｜苹果家庭硬件负责人离职，加入智能戒指公司/黄仁勋回应DLSS5「AI垃圾」争议/9999起，OPPO Find N6正式发布
苹果家庭硬件负责人Brian Lynch离职，加入智能戒指公司Oura。苹果正在研发多款AI可穿戴设备，包括智能显示屏和家庭传感器。OPPO发布Find ...
AIOps 101: The 3 Pillars of Reliably Deploying AI Models (Sponsored)
In the lab, your AI model might seem perfect, but the real world is often whe...