量子位 ·

斯坦福意外用AI生成超强CUDA内核，性能比人类专家优化得还要好！翻倍碾压原生PyTorch，华人主创

💡 原文中文，约3600字，阅读约需9分钟。

📝

内容提要

斯坦福大学的研究团队意外发现，AI生成的CUDA内核性能比人类专家优化提升近400%。通过自然语言生成优化思想和多分支探索模式，他们成功实现了高效内核，展示了AI在内核工程中的巨大潜力。

🎯

❓

AI生成的CUDA内核性能比人类专家优化提升近400%。

研究团队的目标是生成合成数据以训练内核生成模型。

他们采用自然语言生成优化思想和多分支探索模式，鼓励多样化的搜索过程。

AI优化的内核在深度学习操作上超越原生PyTorch，性能显著提升。

团队对未来前景持乐观态度，认为还有很多优化空间。

主要作者包括Anne Ouyang、Azalia Mirhoseini和Percy Liang。

🏷️

Cloudflare 把邮箱改了：一封邮件，就是一次 AI 调用
Cloudflare 电子邮件服务现已支持收发邮件，并可直接接入 AI 处理流程。用户可通过 Workers 发送邮件，无需复杂配置。新功能包括自动记账、...
AI 和集成正在重塑统一通信即服务 (UCaaS) 市场
统一通信即服务（UCaaS）已成为企业首选的通信平台，尽管市场成熟但需求依然强劲。调查显示，57%的企业完全依赖UCaaS，64.9%计划增加支出。企业关...
HashiCorp 创始人亲口“认错”：AI 让我重新爱上了 Go (文末福利)
HashiCorp 创始人 Mitchell Hashimoto 最近表示，AI 的出现让他重新爱上 Go 语言。尽管曾对 Go 表达失望，但他发现 AI...
谷歌会议也将为面对面会议记录AI笔记
谷歌的AI会议记录功能现已扩展，支持Google Meet、面对面会议、Zoom和Microsoft Teams。用户只需在移动应用或桌面上选择“为我记录...
NVIDIA与谷歌云合作推动智能与物理AI的发展
NVIDIA与谷歌云合作推出基于Vera Rubin的A5X实例，支持近百万个Rubin GPU，推动智能和物理AI的发展。新基础设施降低推理成本，提升处...
挖漏洞何必Mythos，国产智能体早跑通了
360集团的漏洞挖掘智能体近期发现了Windows内核提权漏洞和Office远程代码执行漏洞，影响全球超过10亿用户。这些发现展示了AI在漏洞挖掘中的高效...