机器之心 ·

刚刚，DeepSeek开源MoE训练、推理EP通信库DeepEP，真太Open了！

💡 原文中文，约2600字，阅读约需7分钟。

📝

内容提要

DeepSeek 宣布本周为开源周，已开源 FlashMLA 和 DeepEP。DeepEP 是为 MoE 模型设计的高效通信库，支持 NVLink 和 RDMA，优化数据传输和计算速度，提升训练效率。开源后，该库迅速获得关注，Star 数量超过 1000，显示其在 AI 基础设施中的重要性。

🎯

❓

DeepEP是一个专为混合专家系统（MoE）和专家并行（EP）定制的高效通信库，支持NVLink和RDMA，提供高吞吐量和低延迟的GPU内核。

DeepEP通过优化All-to-All通信、支持FP8数据分发和灵活控制GPU资源，实现计算与通信的高效重叠，从而提升训练效率。

DeepSeek在开源周开源了五个软件库，其中包括FlashMLA和DeepEP。

DeepEP开源后，Star数量迅速超过1000，显示其在AI基础设施中的重要性。

DeepEP支持NVLink和RDMA的节点内及跨节点通信，优化数据传输。

DeepSeek通过开源新技术和展示训练效率提升，反驳了关于其技术创新的质疑。

🏷️

[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...
Roku LT OS开源解析：从遥控器系统到电动赛车控制平台
Roku开源了Roku LT OS，旨在为开发者提供轻量化架构和高度确定性的执行能力，适用于嵌入式设备和电动赛车。该系统强调资源控制和时间可预测性，已在电...
便宜好用真香！美国企业把DeepSeek买上了趋势榜第一
Ramp发布的2026年热门软件供应商榜单显示，中国AI公司DeepSeek首次重返增长，企业采用率为0.1%。其成本显著低于Anthropic和Open...
Crown Engine 0.63 恢复了其 OpenGL 渲染器，以支持旧版硬件
Crown Engine 0.63 是一款基于 C++ 的开源游戏引擎，新增 LOD 组组件以优化性能，并支持 OBJ 网格格式。更新改进了 FBX 导入...
VoidZero团队已加入Cloudflare
VoidZero团队已加入Cloudflare，Vite及其相关项目将继续保持开源和中立。Cloudflare承诺投资100万美元支持Vite生态系统的维...
SuperX首个美国AI推理云中心在丹佛投入运营
SuperX AI Technology Limited在丹佛正式启用首个美国AI推理云中心，基于NVIDIA技术，提供高性能、低延迟的AI推理服务，已被...