Ayar Labs 加入 NVLink Fusion 项目,依赖 CPO 技术和 SuperNova 外部光源。SuperNova 的激光阵列由 MACOM 设计,SIVE 制造。文章强调制造环节在光互联技术中的关键作用,指出 SIVE 的高良率和成本优势是成功的关键。A股中多家公司参与相关技术,形成完整产业链。
本文探讨了GPU在大模型训练中的优势,特别是与CPU的对比。GPU通过大量弱核和简化控制实现高算力密度,适合处理大规模矩阵运算。分析了GPU的执行模型、内存层级及Tensor Core的演进,强调带宽与算力平衡对性能的影响,并提出了优化策略以提高GPU在解码阶段的利用率。
在2024-2026年,GPU训练的瓶颈转向网络互联。文章探讨了机内和跨机的互联技术,如NVLink、InfiniBand和RoCEv2,强调LLM训练对网络带宽和延迟的敏感性,需优化通信以提高效率。分析了不同拓扑结构的优缺点,并提出调优方案以解决训练中的网络问题,最终强调网络基础设施在大规模训练中的重要性。
在2025年Computex上,英伟达CEO黄仁勋介绍了公司在数据中心、企业级AI和机器人领域的最新进展,包括AI-First DGX个人计算系统、NVLink Fusion和人形机器人开发工具,推动IT基础设施向AI工厂转型。
超级加速器连接联盟UALink新增阿里云、苹果和新思科技成员,旨在打破英伟达NVLink垄断,推动AI加速器互连标准的开放发展。联盟现有60多家成员,计划于2025年发布UALink 1.0,提供200Gbps带宽,连接最多1000台加速器。
英特尔与AMD等公司成立超级加速器连接联盟(UALink),旨在对抗英伟达的NVLink技术。该联盟将制定AI数据中心服务器之间的高速通信标准,计划于2025年发布,支持最多1024个加速器连接。
AI和高性能计算需求增长,需要无缝连接多GPU。NVIDIA的NVLink技术提供更快速的多GPU替代方案,实现显存和性能扩展。NVLink进入第4代,达到900 G/s。NVSwitch是NVIDIA开发的高性能互连交换机,用于构建大规模GPU集群,提供高带宽、低延迟通信通道。
完成下面两步后,将自动完成登录并继续当前操作。