本研究提出了一种混合压缩策略,通过与GPU压缩库共同设计的MPI库,解决了大型语言模型训练中通信开销的问题。实验结果显示,该方法能够提高每个GPU的TFLOPS和样本处理速度。
完成下面两步后,将自动完成登录并继续当前操作。