Pack-wise Post-training Quantization: Advancing Post-training Quantization of Neural Networks through Pack-wise Reconstruction
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新颖的后训练量化方法Pack-PTQ,旨在解决低比特情况下的准确性下降问题。通过自适应打包机制和混合精度量化,Pack-PTQ有效保留了块间依赖性,显著提升了量化性能。实验结果表明,其在2D图像和3D点云分类任务中优于现有技术。
🎯
关键要点
- 本研究提出了一种新颖的后训练量化方法Pack-PTQ,旨在解决低比特情况下的准确性下降问题。
- Pack-PTQ通过引入海森引导的自适应打包机制,有效保留了块间依赖性。
- 该方法采用混合精度量化,根据灵敏度分配不同的位宽,从而显著提升了量化性能。
- 实验结果表明,Pack-PTQ在2D图像和3D点云分类任务中优于现有的PTQ技术。
➡️