量子位 ·

让64张卡像一张卡！浪潮信息发布新一代AI超节点，支持四大国产开源模型同时运行

💡 原文中文，约3100字，阅读约需8分钟。

📝

内容提要

浪潮信息推出的元脑SD200超节点AI服务器，支持四大国产开源模型同时运行，具备万亿参数推理能力。其64张卡融合为统一内存，采用3D Mesh架构，降低延迟，提升计算效率，满足Agentic AI时代的多模型协作需求。

🎯

🔎

随着Agentic AI的兴起，单一模型已无法满足复杂任务的需求。元脑SD200的设计正是为了支持多模型的实时协作，能够在同一平台上高效运行多个大模型，满足日益增长的计算与通信需求。

元脑SD200通过3D Mesh架构实现了百纳秒级的低延迟通信，这在处理小数据包时尤为重要。相比传统网络，元脑SD200能够显著减少跨机通信带来的延迟，提升整体推理性能。

元脑SD200采用开放架构，支持多种计算平台，降低了用户的迁移成本。这种设计不仅促进了算力的多样性选择，也为产业链上下游的合作提供了机会，推动了开源生态的发展。

❓

元脑SD200支持四大国产开源模型同时运行，具备万亿参数推理能力，满足多模型协作需求。

通过将64张卡融合为统一内存，采用3D Mesh架构，降低延迟并提升计算效率。

它通过超线性扩展和低延迟通信，支持超大模型的实时协作，满足智能体的多模型交互需求。

开放架构允许多种计算平台兼容运行，降低了迁移成本，用户可快速迁移现有模型。

元脑SD200实现了百纳秒级的低延迟通信，端到端时延优于业界主流方案。

随着Agentic AI时代的到来，推理能力和计算需求急剧增加，传统网络无法满足新需求，因此推出了元脑SD200。

🏷️