量子位 ·

Bye，英伟达！华为NPU，跑出了准万亿参数大模型

💡 原文中文，约5400字，阅读约需13分钟。

📝

内容提要

华为成功训练出7180亿参数的MoE大模型，标志着国产NPU在AI领域的突破。通过优化架构和提升通信效率，华为克服了超大模型训练的挑战，展现了中国科技的自主创新能力。

🎯

关键要点

华为成功训练出7180亿参数的MoE大模型，标志着国产NPU在AI领域的突破。
华为克服了超大模型训练中的负载均衡、通信开销和训练效率等挑战。
华为盘古团队基于昇腾国产算力平台，完成了7180亿参数MoE模型的长期稳定训练。
训练超大参数MoE模型面临架构参数优化、动态负载均衡、分布式通信瓶颈和硬件适配复杂度等四大挑战。
华为通过优化模型架构、训练分析和系统优化等技术手段解决了这些问题。
团队开发了建模仿真工具，准确率达到85%以上，帮助评估模型性能。
为解决负载不均衡问题，团队研发了全新的EP组负载均衡损失算法。
在训练过程中，采用了dropless方案以提升训练效率。
团队通过优化并行计算策略和数据传输效率，显著提高了模型的算力利用率。
设计了分级EP通信和自适应前反向掩盖策略以解决通信瓶颈。
团队实施严格的数据质量控制，确保训练数据集的多样性和复杂性。
盘古Ultra MoE在多领域展现出卓越竞争力，特别是在数学推理和代码生成任务中表现优异。
专家专业度分析显示，盘古Ultra MoE形成显著的专家差异化，增强了模型的表达能力。
华为的技术突破证明了中国企业在全球AI竞赛中具备从跟跑到并跑，甚至领跑的实力。

❓

延伸问答

华为的MoE大模型有多少参数？

华为的MoE大模型有7180亿参数。

华为是如何克服超大模型训练中的挑战的？

华为通过优化模型架构、动态负载均衡和系统优化等技术手段克服了训练中的挑战。

华为的盘古Ultra MoE在什么领域表现优异？

盘古Ultra MoE在数学推理和代码生成任务中表现优异。

华为在训练MoE模型时面临哪些主要挑战？

主要挑战包括架构参数优化、动态负载均衡、分布式通信瓶颈和硬件适配复杂度。

华为的负载均衡损失算法有什么创新之处？

华为研发的全新EP组负载均衡损失算法在资源消耗上更为高效，避免了过度强求局部任务分配的绝对均衡。

华为的技术突破对中国科技有什么意义？

华为的技术突破标志着中国企业在全球AI竞赛中具备从跟跑到并跑，甚至领跑的实力，彰显了自主创新能力。

🏷️

继续阅读

美国Meta收购Manus紧急叫停；百度发全员信通知职级体系大调整；华为曼谷发布会定档5月7日
美国Meta收购Manus被禁止，百度调整职级体系，华为将在曼谷发布新产品，微软与OpenAI修订合作协议，谷歌将在韩国建设AI园区，韩国股市超越英国成为全球第八大股市。
作为 Snipaste 付费用户，试完 PixPin 3 我动摇了，就差最后一点细节
PixPin 3.1.4.0 版本推出，进行了界面重构，接入 AI 技术以提升识别与翻译能力，新增自动马赛克、贴图穿透和条码识别等功能。大部分功能免费，部...
您的大型语言模型问题实际上是数据问题
本文讨论了AI和大型语言模型（LLM）在处理实时结构化生产数据时的挑战。嘉宾Harsha Chintalapani指出，模式变化、不一致的定义和薄弱的治理...
GTC2026 全球流量大会（深圳）圆满收官：25000+出海人到场，11月4-5日，我们上海见！
GTC2026全球流量大会于4月23日至24日在深圳举行，吸引了超过25000名观众和170家展商。大会聚焦出海策略，涵盖AI、短剧等主题，分享实战经验和...
数据库开源发展联盟在济南成立
4月27日，济南举行中国数据库开源发展峰会，宣布成立数据库开源发展联盟。会议聚焦数据库优化与AI融合，发布PGNexus平台，旨在提升中国在国际开源领域的影响力。
ASAPP 在 CXP 中推出多个 AI 代理，以提升企业客户服务水平
ASAPP推出了一套AI驱动的客户服务平台CXP，旨在提供端到端的客户服务。该平台通过五种专用代理协同工作，能够自我学习并提供可操作的见解，从而提升客户服...