小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

在2024-2026年,GPU训练的瓶颈转向网络互联。文章探讨了机内和跨机的互联技术,如NVLink、InfiniBand和RoCEv2,强调LLM训练对网络带宽和延迟的敏感性,需优化通信以提高效率。分析了不同拓扑结构的优缺点,并提出调优方案以解决训练中的网络问题,最终强调网络基础设施在大规模训练中的重要性。

【大模型基础设施工程】04:互联与网络——NVLink、InfiniBand、RoCE 与国产替代

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
InfiniBand 与 RoCEv2:为大规模 AI 选择合适的网络

GPU 是人工智能的核心,但在大规模训练中,网络通信速度限制了性能。RDMA 和 GPUDirect 技术通过绕过 CPU 实现 GPU 直接通信,降低延迟。InfiniBand 性能高但成本高,RoCEv2 更经济灵活,适合现有以太网环境。选择应基于预算和性能需求。

InfiniBand 与 RoCEv2:为大规模 AI 选择合适的网络

实时互动网
实时互动网 · 2025-08-07T09:52:55Z

本文介绍了Infiniband RDMA编程,作者为Insu Jang,提供了相关代码和资源链接,适合对高性能计算感兴趣的读者。

RDMA 101 - libverbs API 和你好世界

shrik3
shrik3 · 2025-07-21T18:28:23Z
InfiniBand与RoCE的比较

NVIDIA的InfiniBand和RoCE是高性能网络技术。InfiniBand适合追求低延迟和高性能的HPC和金融领域,而RoCE则适合成本敏感的数据中心和云环境。选择依据需求:极致性能选择InfiniBand,整合现有基础设施选择RoCE。

InfiniBand与RoCE的比较

DEV Community
DEV Community · 2025-05-06T11:31:08Z

InfiniBand是一种高性能计算网络标准,具备高吞吐量和低延迟,适用于计算机间的数据传输。它支持远程直接内存访问(RDMA),数据传输速率超过200 Gbps。网络分为两层,通过安装驱动程序可优化性能,并提供多种监控和测试命令以评估网络状态。

InfiniBand 网络及常用命令

陈少文的博客
陈少文的博客 · 2024-11-02T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码