小红花·文摘 - 小红花技术领袖俱乐部

机器之心数据服务现已上线，提供高效稳定的数据获取服务，帮助用户轻松获取所需数据。

A800、H800都低到这个价了，这个暑假搞了点算力福利

机器之心 ·

DeepSeek研究员俞星凯用不到1200行代码复刻了vLLM，命名为Nano-vLLM，具备快速离线推理和良好的可读性。在H800硬件上，Nano-vLLM的性能超越原版，展现出高效性和简洁性。

DeepSeek研究员1200行代码复刻vLLM，H800硬件实测性能反超原版

量子位 ·

DeepSeek推出FlashMLA，突破H800性能限制，显著降低计算成本。该解码内核专为Hopper GPU优化，支持BF16，提升内存和推理效率。MLA架构通过低秩压缩技术减少存储需求，推理成本大幅降低，受到全球关注。

DeepSeek突破H800性能上限，FlashMLA重磅开源，算力成本还能降

量子位 ·