小红花·文摘

本文探讨了大模型训练中的开源框架，包括Megatron-LM、DeepSpeed和FSDP2。Megatron-LM专注于张量并行，适合超大模型；DeepSpeed通过ZeRO优化显存使用，易于集成；FSDP2提供简洁的API，支持与其他并行策略结合。文章分析了不同框架的优缺点及适用场景，帮助工程师选择合适的训练框架。

【大模型基础设施工程】07：Megatron-LM 与 DeepSpeed

土法炼钢兴趣小组的博客 ·

微软成功拦截AI生成的钓鱼攻击，NVIDIA修复高危漏洞，Linux内核曝出HID漏洞，思科修复零日漏洞，毒蛇组织运营恶意广告网络，LNK攻击绕过Windows安全，恶意Rust组件窃取加密货币密钥，PyPI维护者遭钓鱼攻击，GitLab修复DoS漏洞，朝鲜黑客针对加密货币开发者。

FreeBuf早报 | AI对抗AI：微软拦截LLM网络钓鱼攻击；NVIDIA修复Megatron-LM高危漏洞

FreeBuf网络安全行业门户 ·

NVIDIA发布安全更新，修复Megatron-LM中的四个高危漏洞，CVSS评分为7.8，可能导致代码执行和数据篡改。受影响版本为0.13.1及以下，建议用户立即更新。

NVIDIA修复Megatron-LM AI框架中的高危代码注入漏洞

FreeBuf网络安全行业门户 ·

NVIDIA 宣布其开源语言模型框架 Megatron-LM 存在两个高危漏洞（CVE-2025-23264 和 CVE-2025-23265），CVSS 评分为 7.8，可能导致远程代码执行和数据篡改。漏洞源于 Python 组件处理不当，影响 0.12.0 之前版本，已在 0.12.1 中修复。

NVIDIA Megatron-LM 存在双重注入风险：v0.12.1 版本修复代码执行漏洞

FreeBuf网络安全行业门户 ·

探索NVIDIA Megatron LM的激动人心的可能性：使用PyTorch和NVIDIA Apex的有趣友好的代码演示！

DEV Community ·

这款自变形的威震天既酷炫又昂贵

The Verge ·

随着大模型技术的发展，MoE大模型证明了稀疏MoE技术能降低计算量、提升推理速度，模型效果甚至超过同规模稠密模型。阿里云PAI和NVIDIA团队合作，基于Megatron-Core MoE框架，解决了MoE大模型训练落地时的核心问题，在下游任务上取得了很好的模型效果。Megatron-Core MoE支持并行性、路由和负载均衡等特性，提供了一个强大的MoE训练框架。阿里云PAI的MoE训练工具由PAI平台、PAI-Megatron-Patch和NVIDIA Megatron-Core组成。通过测试，验证了训练工具的可靠性和稳定性。

【大模型基础设施工程】07：Megatron-LM 与 DeepSpeed

FreeBuf早报 | AI对抗AI：微软拦截LLM网络钓鱼攻击；NVIDIA修复Megatron-LM高危漏洞

NVIDIA修复Megatron-LM AI框架中的高危代码注入漏洞

NVIDIA Megatron-LM 存在双重注入风险：v0.12.1 版本修复代码执行漏洞

探索NVIDIA Megatron LM的激动人心的可能性：使用PyTorch和NVIDIA Apex的有趣友好的代码演示！

这款自变形的威震天既酷炫又昂贵

基于 Megatron-Core 的稀疏大模型训练工具：阿里云MoE大模型最佳实践

阿里云PAI-灵骏大模型训练工具 Pai-Megatron-Patch 正式开源！

大模型并行训练指南：通俗理解Megatron-DeepSpeed之模型并行与数据并行

Megatron with FastMoE