PipeFusion: 扩散变压器模型推理的位移块并行处理
原文中文,约400字,阅读约需1分钟。发表于: 。介绍了 PipeFusion 的一种新方法,利用多 GPU 并行性来解决扩散变压器(DiT)模型生成高分辨率图像的高计算和延迟挑战。通过分割图像并在多个设备上分布网络层,以管道并行的方式编排通信和计算,利用相邻扩散步骤输入的高相似性,通过重用一步陈旧的特征图为当前步骤提供上下文,实验结果表明,PipeFusion 能够在现有 DiT 并行方法无法满足 OOM...
PipeFusion是一种利用多GPU并行性解决DiT模型生成高分辨率图像的新方法。通过管道并行编排通信和计算,实现更高的图像分辨率。PipeFusion降低了通信带宽需求,降低了整体运营费用。