量子位 ·

Kimi开源新线性注意力架构，首次超越全注意力模型，推理速度暴涨6倍

💡 原文中文，约1900字，阅读约需5分钟。

📝

内容提要

Kimi开源的线性注意力架构首次超越全注意力模型，推理速度提升6倍，KV缓存减少75%。其核心创新Kimi Delta Attention引入细粒度遗忘门控，确保长上下文中的稳定性。该模型在多个基准测试中表现优异，标志着AI架构进入多元创新时代。

🎯

关键要点

Kimi开源的线性注意力架构首次超越全注意力模型，推理速度提升6倍。
KV缓存需求减少75%。
Kimi Linear的核心创新是Kimi Delta Attention，引入细粒度遗忘门控，确保长上下文中的稳定性。
Kimi Linear采用3:1的混合层设计，结合线性注意力和全注意力。
模型通过Diagonal-Plus-Low-Rank结构优化注意力矩阵，提高并行计算效率。
Kimi Linear在多个基准测试中表现优异，超越传统Transformer。
AI架构正在告别对传统Transformer的依赖，迈向多元创新时代。

🏷️

继续阅读

演讲：Kraken的无服务器架构助力电网绿色发展
伦敦电网平均提供30千瓦电力，其中15%用于本地，40%来自可再生能源。风能波动大，需要技术支持电网稳定。电池储能至关重要，需控制充放电。电力市场分为计划...
迷你书：AI时代的架构：变革与机遇
现代软件架构面临挑战，AI迅速发展导致系统复杂性增加，架构师的角色也在不断演变。团队需在自主性与一致性之间找到平衡，同时确保系统的可靠性。本文汇集行业见解...
当开源的门缝变窄，真正需要我们警觉的是什么？
2025年4月13日，中国开发者在访问GitHub时遭遇403访问限制，标志着该平台对中国的封锁。这一事件影响了全球开源生态，促使开发者重新思考技术依赖，...
跨平台 iCloud 照片同步，命令行自动下载备份工具 | 开源日报 No.859
IPTV 提供全球免费高清电视频道，vllm-omni 是高效的多模态模型推理框架，Vendure 是可定制的无头电商平台，icloud_photos_d...
DeepSeek 与开源：肥沃土壤孕育 AI 硕果
中国开源生态经过二十年的发展，从零散探索到繁荣，推动了国产AI技术的崛起。DeepSeek等项目的成功得益于开源社区的积累与协作。尽管面临国际竞争，国内开...
开源中国入选「2025年度中国软件高质量发展百强企业」
在2025中国软件高质量发展大会上发布了《中国软件产业高质量发展报告（2025）》，北京奥思研工智能科技有限公司被评为百家高质量企业。开源中国通过Gite...

Kimi开源新线性注意力架构，首次超越全注意力模型，推理速度暴涨6倍

内容提要

关键要点

标签

继续阅读