Kimi开源的线性注意力架构首次超越全注意力模型,推理速度提升6倍,KV缓存减少75%。其核心创新Kimi Delta Attention引入细粒度遗忘门控,确保长上下文中的稳定性。该模型在多个基准测试中表现优异,标志着AI架构进入多元创新时代。
完成下面两步后,将自动完成登录并继续当前操作。