华为云再掀算力风暴:CloudMatrix384超节点将升级,Tokens服务性能最大可超H20四倍

💡 原文中文,约5100字,阅读约需12分钟。
📝

内容提要

华为云在全联接大会2025上宣布升级CloudMatrix384超节点,算力性能将超越H20四倍。新推出的Tokens服务按实际消耗计费,显著降低AI推理成本,致力于为企业提供高效、可靠的AI算力支持,推动各行业的AI创新与应用。

🎯

关键要点

  • 华为云在全联接大会2025上宣布升级CloudMatrix384超节点,算力性能将超越H20四倍。
  • 新推出的Tokens服务按实际消耗计费,显著降低AI推理成本。
  • CloudMatrix的云上超节点规格将从384卡升级到8192卡,支持百万卡的超大集群。
  • 华为云Tokens服务接入CloudMatrix384超节点,提供极致性能的Tokens服务体验。
  • 华为云的“算力黑土地”理念为企业和开发者提供AI创新实践的肥沃土壤。
  • 智算与通算协同推进,智算聚焦AI前沿,通算提供安全可信的云上通用算力。
  • Tokens服务模式能精准计算企业资源使用,优化成本,解决收费不公问题。
  • CloudMatrix384超节点通过高速互联架构释放极致算力,支持大规模AI集群。
  • EMS弹性内存存储服务提升多轮对话时延,优化资源利用率。
  • 华为云为国家级科研机构提供高精度、高专业性的算力需求支持。
  • 华为云的全栈研发体系与长期高额研发投入为算力输出提供保障。

延伸问答

华为云的CloudMatrix384超节点有什么升级?

CloudMatrix384超节点的规格将从384卡升级到8192卡,算力性能将超越H20四倍。

华为云的Tokens服务如何降低AI推理成本?

Tokens服务按实际消耗计费,能更精准计算企业资源使用,用户仅为实际消耗付费,从而显著降低AI推理成本。

华为云的“算力黑土地”理念是什么?

“算力黑土地”理念是华为云为企业和开发者提供一个肥沃的环境,以支持AI创新实践。

CloudMatrix384超节点的技术优势有哪些?

CloudMatrix384超节点通过高速互联架构和EMS弹性内存存储服务,显著提升算力和资源利用率,支持大规模AI集群。

华为云如何支持国家级科研机构的算力需求?

华为云为国家级科研机构提供基于国产化昇腾芯片的昇腾AI云服务,满足高精度、高专业性的算力需求。

华为云的智算与通算有什么区别?

智算聚焦于AI前沿,提供极致性能与弹性服务;通算则依托鲲鹏云服务,提供安全可信的通用算力。

➡️

继续阅读