ViDiT-Q: 图像和视频生成的扩散变压器的高效准确量化
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种名为PTQ4DiT的后训练量化方法,用于解决Diffusion Transformers(DiTs)中的量化挑战。该方法通过CSB和SSC解决通道不平衡和时间变化问题,并通过离线重新参数化策略降低计算成本。该方法实现了对DiTs的有效量化到8位精度(W8A8),并首次实现了对4位权重精度(W4A8)的有效量化。
🎯
关键要点
- 提出了一种名为PTQ4DiT的后训练量化方法。
- 该方法解决了Diffusion Transformers(DiTs)中的量化挑战。
- 通过CSB和SSC解决通道不平衡和时间变化问题。
- 采用离线重新参数化策略降低计算成本。
- 实现了对DiTs的有效量化到8位精度(W8A8)。
- 首次实现了对4位权重精度(W4A8)的有效量化。
🏷️
标签
➡️