机器之心 ·

刚刚，DeepSeek开源FlashMLA，推理加速核心技术，Star量飞涨中

💡 原文中文，约1300字，阅读约需3分钟。

📝

内容提要

上周五，DeepSeek 宣布本周为开源周，首个开源项目是针对 Hopper GPU 的 FlashMLA 解码核，旨在提升推理效率。该项目上线45分钟内获得400多个星标，优化了可变长度序列服务，支持高达3000 GB/s 的内存速度和 580 TFLOPS 的计算能力。

🎯

关键要点

DeepSeek 宣布本周为开源周，将连续开源五个软件库。
首个开源项目是针对 Hopper GPU 的 FlashMLA 解码核，旨在提升推理效率。
FlashMLA 项目上线 45 分钟内获得超过 400 个星标，显示出强烈的社区关注。
MLA 是 DeepSeek 大模型的重要技术创新，减少推理过程的 KV Cache，降低推理成本。
FlashMLA 针对可变长度序列服务进行了优化，支持高达 3000 GB/s 的内存速度和 580 TFLOPS 的计算能力。
部署 FlashMLA 需要 Hopper GPU、CUDA 12.3 及以上版本和 PyTorch 2.0 及以上版本。
项目发布后获得好评，网友调侃称第五天会是 AGI。

❓

延伸问答

FlashMLA项目的主要功能是什么？

FlashMLA项目旨在提升推理效率，特别是针对可变长度序列服务进行了优化。

DeepSeek的开源周包括哪些内容？

DeepSeek的开源周将连续开源五个软件库，首个项目是FlashMLA解码核。

FlashMLA的性能指标是什么？

FlashMLA支持高达3000 GB/s的内存速度和580 TFLOPS的计算能力。

部署FlashMLA需要哪些硬件和软件要求？

部署FlashMLA需要Hopper GPU、CUDA 12.3及以上版本和PyTorch 2.0及以上版本。

FlashMLA项目上线后反响如何？

FlashMLA项目上线45分钟内获得超过400个星标，显示出强烈的社区关注和好评。

MLA技术在DeepSeek大模型中的作用是什么？

MLA技术主要减少推理过程的KV Cache，从而降低推理成本，支持更长的Context。

🏷️

继续阅读

DeepSeek首轮500亿元融资细节曝光：估值4000亿，腾讯、宁德时代都来了
国内AI企业DeepSeek即将完成首轮融资，计划募资约500亿元，投资方包括腾讯和宁德时代。融资后估值预计达3500亿至4000亿元。创始人梁文锋将投入...
百度文心发布 PaddleOCR-VL-1.6：准确率突破 96.33%，刷新文档解析 SOTA
百度发布的PaddleOCR-VL-1.6在OmniDocBench v1.6评测中准确率超过96.3%，综合性能全球第一，支持100多种语言，适应复杂文...
Free CPU教程丨西湖大学张岳团队开源科研插图神器AutoFigure，可精准理解长篇科学文本
西湖大学的张岳团队推出了智能科研插图生成系统AutoFigure，旨在解决高质量科研插图的生成难题。该系统基于长篇科学文本，确保插图的逻辑结构准确且视觉美...
阿里云免费DNS限速来了！解析量超标限速？附替代方案推荐
阿里云宣布自2026年6月24日起，免费版云解析DNS将实施每日解析量限额（10万次）。超限后可能影响解析稳定性，建议用户关注解析量并考虑升级付费版。用户...
早报｜微软发布Windows「梦中神机」/腾讯云DeepSeek-V4最高降价97.5%/徕卡相机或被中国资本收购
微软在Build 2026大会上发布了七款自研AI模型，涵盖推理、代码、图像和语音等领域，并推出了强大算力的开发者设备“梦中神机”。OpenAI扩展Cod...
微软首款高级推理人工智能问世
微软在2026年Build大会上发布了多款新AI模型，旗舰模型MAI-Thinking-1是其自主开发的重要进展，表现优异，基于干净数据训练。此外，还推出...