阿里云 eRDMA 测试及 PD 分离应用部署
💡
原文中文,约8500字,阅读约需21分钟。
📝
内容提要
在PD分离部署中,异构显卡会增加跨机通信压力。通过RDMA设备加速kvcache传输,降低FTTL。安装驱动后可选择标准或兼容模式,兼容模式支持更多应用。性能测试显示eRDMA速度接近25.0 Gbps。配置和测试过程包括安装工具、查看设备信息及启动容器环境。
🎯
关键要点
- PD分离部署中,异构显卡增加跨机通信压力。
- 使用RDMA设备加速kvcache传输以降低FTTL。
- 安装驱动后可选择标准或兼容模式,兼容模式支持更多应用。
- eRDMA速度接近25.0 Gbps,卡数越多速度越快。
- 性能测试显示实际测速为3GB/s,与标称速度接近。
- 查看设备信息和状态以确认配置正确。
- 安装perftest工具进行性能测试,包括测速和测延时。
- 部署eRDMA exporter以图形化查看性能。
- 在PD应用测试中,挂载模型并启动vLLM容器环境。
- 启动Proxy服务以验证推理,prefill节点发送数据,decoder节点接收数据。