机器之心 ·

线性扩散模型LiT来了，用极简线性注意力助力扩散模型AIPC时代端侧部署

💡 原文中文，约8700字，阅读约需21分钟。

📝

内容提要

AIxiv专栏促进学术交流，报道超过2000篇内容。香港大学与华为合作提出高效扩散模型LiT，利用简化线性注意力在离线状态下快速生成1K分辨率图像，展示其在文生图任务中的潜力。

🎯

🔎

LiT模型采用的线性注意力机制在计算效率上具有显著优势，尤其是在处理高分辨率图像时。与传统的自注意力相比，线性注意力能够实现更快的计算速度和更低的内存消耗，这使得LiT在边缘设备上的应用成为可能。对于需要快速生成图像的场景，线性注意力的并行化特性尤为重要。

LiT的离线部署能力使其在没有网络连接的情况下仍能高效生成高分辨率图像，这为边缘计算设备的应用提供了新的可能性。用户可以在个人电脑上直接使用LiT进行图像生成，降低了对云计算资源的依赖，适合对隐私和数据安全有较高要求的应用场景。

LiT提出的训练策略通过知识蒸馏和权重继承等方法，显著降低了训练成本和时间。与传统模型相比，LiT在较少的训练迭代下仍能达到相似的性能，这为研究人员和开发者提供了更高效的模型训练方案，尤其是在资源有限的情况下。

❓

LiT模型使用简化线性注意力，能够在离线状态下快速生成1K分辨率的图像，具有高效的计算性能。

LiT-0.6B可以在Windows笔记本电脑上离线部署，遵循用户指令生成图像。

LiT在文生图任务中展示了其潜力，能够生成高分辨率的逼真图像，并在ImageNet基准上表现优异。

LiT提出了5条指导原则，包括使用简化线性注意力、减少头数量、从预训练模型继承权重等。

线性注意力具有简洁和高并行化的特点，计算复杂度低，适合高分辨率图像生成。

LiT在训练时使用较少的迭代数即可实现相当的FID结果，显示出高效的训练成本。

🏷️