Meta开源了RCCLX,这是RCCL的增强版,旨在加速AI模型创新。新特性包括直接数据访问(DDA)和低精度集体通信,显著提升AMD平台性能。DDA减少延迟,低精度集体优化通信开销,支持FP32和BF16数据类型,并与Torchcomms集成,简化跨平台通信。
完成下面两步后,将自动完成登录并继续当前操作。