ViDiT-Q: 图像和视频生成的扩散变压器的高效准确量化

BriefGPT - AI 论文速递 BriefGPT - AI 论文速递 ·

本文提出了一种名为PTQ4DiT的后训练量化方法,用于解决Diffusion Transformers(DiTs)中的量化挑战。该方法通过CSB和SSC解决通道不平衡和时间变化问题,并通过离线重新参数化策略降低计算成本。该方法实现了对DiTs的有效量化到8位精度(W8A8),并首次实现了对4位权重精度(W4A8)的有效量化。

原文中文,约300字,阅读约需1分钟。
阅读原文