ViDiT-Q: 图像和视频生成的扩散变压器的高效准确量化

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文提出了一种名为PTQ4DiT的后训练量化方法,用于解决Diffusion Transformers(DiTs)中的量化挑战。该方法通过CSB和SSC解决通道不平衡和时间变化问题,并通过离线重新参数化策略降低计算成本。该方法实现了对DiTs的有效量化到8位精度(W8A8),并首次实现了对4位权重精度(W4A8)的有效量化。

🎯

关键要点

  • 提出了一种名为PTQ4DiT的后训练量化方法。
  • 该方法解决了Diffusion Transformers(DiTs)中的量化挑战。
  • 通过CSB和SSC解决通道不平衡和时间变化问题。
  • 采用离线重新参数化策略降低计算成本。
  • 实现了对DiTs的有效量化到8位精度(W8A8)。
  • 首次实现了对4位权重精度(W4A8)的有效量化。
➡️

继续阅读