小红花·文摘 - 小红花技术领袖俱乐部

DeepSeek 开源的 FlashMLA 项目在 NVIDIA Grace Hopper 架构上显著降低了内存和计算开销，提高了响应速度，适合处理变长序列。该项目已在 GitHub 上开源，开发者可快速部署并验证其性能。

DeepSeek开源周首日推出FlashMLA项目可以显著降低内存占用和计算开销

蓝点网 ·

革新AI推理：DeepSeek发布FlashMLA——Hopper GPU的颠覆性加速工具

革新AI推理：DeepSeek发布FlashMLA——Hopper GPU的颠覆性加速工具

DEV Community ·

DeepSeek开源FlashMLA：Hopper GPU解码新标杆，测评大揭秘！

DeepSeek开源FlashMLA：Hopper GPU解码新标杆，测评大揭秘！

机器之心 ·

一文看懂 DeepSeek 刚刚开源的 FlashMLA，这些细节值得注意

一文看懂 DeepSeek 刚刚开源的 FlashMLA，这些细节值得注意

爱范儿 ·

DeepSeek推出FlashMLA，突破H800性能限制，显著降低计算成本。该解码内核专为Hopper GPU优化，支持BF16，提升内存和推理效率。MLA架构通过低秩压缩技术减少存储需求，推理成本大幅降低，受到全球关注。

DeepSeek突破H800性能上限，FlashMLA重磅开源，算力成本还能降

量子位 ·

刚刚，DeepSeek开源FlashMLA，推理加速核心技术，Star量飞涨中

刚刚，DeepSeek开源FlashMLA，推理加速核心技术，Star量飞涨中

机器之心 ·