小红花·文摘 - 小红花技术领袖俱乐部

Kimi新论文：把KVCache玩成新商业模式了

量子位 ·

模块化：KVCache的五个时代

模块化：KVCache的五个时代

Modular Blog ·

在PD分离部署中，异构显卡会增加跨机通信压力。通过RDMA设备加速kvcache传输，降低FTTL。安装驱动后可选择标准或兼容模式，兼容模式支持更多应用。性能测试显示eRDMA速度接近25.0 Gbps。配置和测试过程包括安装工具、查看设备信息及启动容器环境。

阿里云 eRDMA 测试及 PD 分离应用部署

陈少文的博客 ·

随着PD分离系统的推广，kvcache传输影响了用户体验。通过采用nccl和改进发送行为，传输性能显著提升，提升幅度达到42.90%。

PD 分离中的 kvcache 传输优化

学习让我快乐 ·