量子位 ·

何恺明LeCun改造Transformer！9行代码替代归一化性能不减还加速

💡 原文中文，约3000字，阅读约需8分钟。

📝

内容提要

何恺明与LeCun提出的DyT（动态Tanh）模块可替代Transformer中的归一化层，性能相当且加速，已开源。DyT模块仅需9行代码，适用于多种模型，实验表明其在效率和效果上优于传统归一化方法。

🎯

🏷️

LeCun创业0产品估值247亿，回应谢赛宁入伙
LeCun创办的Advanced Machine Intelligence（AMI）估值247亿，专注于世界模型，强调开源和理解真实世界的重要性。他批评M...
当开源的门缝变窄，真正需要我们警觉的是什么？
2025年4月13日，中国开发者在访问GitHub时遭遇403访问限制，标志着该平台对中国的封锁。这一事件影响了全球开源生态，促使开发者重新思考技术依赖，...
🌟 GSoC 2026 来了！与我们一起迎接又一个创新之年 🌟
谷歌夏季代码（GSoC）2026正式启动，ASF将连续第21年参与。GSoC旨在吸引新贡献者参与开源软件开发，项目持续12周以上。自2005年以来，ASF...
为什么平台公司不断收购前端框架团队
Cloudflare最近收购了前端框架Astro，反映出大型平台对流行框架的支持。Cloudflare希望通过Astro推动更好的互联网，支持独立网站，并...
Open Notebook：真正的开源私有NotebookLM替代品？
Open Notebook是一个开源AI平台，旨在安全记录和管理笔记，避免敏感数据泄露。与云端笔记本不同，它支持本地部署，确保用户对数据的完全控制。该平台...
2026年1月MySQL性能评估
本文分析了Community MySQL、Percona Server和MariaDB的最新性能基准测试。结果显示，Percona Server与MySQ...