ViDiT-Q: 图像和视频生成的扩散变压器的高效准确量化
原文中文,约300字,阅读约需1分钟。发表于: 。Diffusion transformers have challenges in quantization, but the proposed ViDiT-Q method achieves lossless W8A8 quantization and ViDiT-Q-MP achieves W4A8 with negligible visual quality degradation,...
本文提出了一种名为PTQ4DiT的后训练量化方法,用于解决Diffusion Transformers(DiTs)中的量化挑战。该方法通过CSB和SSC解决通道不平衡和时间变化问题,并通过离线重新参数化策略降低计算成本。该方法实现了对DiTs的有效量化到8位精度(W8A8),并首次实现了对4位权重精度(W4A8)的有效量化。