高质量扩散模型的低比特浮点量化

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本研究提出了BinaryDM,一种准确的量化感知训练方法,将扩散模型权重推向1位极限。BinaryDM在精度和效率上显著改进,可实现16.0倍FLOPs和27.1倍存储节省。

🎯

关键要点

  • 本研究提出了BinaryDM,一种新颖的准确的量化感知训练方法。
  • BinaryDM旨在将扩散模型的权重推向1位极限。
  • 使用Learnable Multi-basis Binarizer (LMB)来恢复二元化扩散模型生成的表示。
  • 使用Low-rank Representation Mimicking (LRM)来提高二元化感知优化。
  • 通过渐进的初始化策略训练扩散模型,避免收敛困难。
  • BinaryDM在精度和效率上显著改进,优于超低位宽下的DM的SOTA量化方法。
  • BinaryDM在1位权重和4位激活的情况下可实现16.0倍的FLOPs和27.1倍的存储节省。
  • BinaryDM展示了其在资源有限场景中的巨大优势和潜力。
➡️

继续阅读