BriefGPT - AI 论文速递 ·

视觉 Transformer 的实例感知组量化

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文介绍了多种视觉变换器的量化方法，包括双均匀量化、后训练量化和基于知识蒸馏的量化，旨在提升模型在移动设备上的性能和准确性。研究表明，这些方法在 ImageNet 数据集上实现了接近无损的预测准确度，并显著降低了计算成本。

🎯

关键要点

提出了双均匀量化方法和用 Hessian 指导的指标方法，优化视觉转换器的量化准确度。
PTQ4ViT 框架在 ImageNet 分类任务上实现了接近无损的预测准确度，8 位量化的准确度降低小于 0.5%。
SmoothQuant with bias term (SQ-b) 和 optimal scaling factor ratio search (OPT-m) 方法在 4 位和 5 位量化的 ViTs 上显著提高了准确度。
开发了基于 Power-of-Two Factor（PTF）和 Log-Int-Softmax（LIS）的技术，简化全量化视觉 Transformer 的推理复杂度。
提出了一种新的后训练量化方法，显著提高了 MobileViTv1 和 MobileViTv2 的平均准确性，达到 7.75%。
有效的后训练量化算法降低了视觉变换器的内存存储和计算成本，在 ImageNet 数据集上获得约 8 位量化的 81.29% top-1 精度。
基于知识蒸馏的变异感知量化方法提高了 Vision Transformers 模型的准确性和训练效率。
基于 patch 的混合精度量化方法通过引入轻量级全局度量，减少了搜索成本，使混合精度量化应用于 ViTs 更加容易。
基于信息矫正模块和分布引导蒸馏方案的量化视觉变换器压缩方法在 ImageNet 数据集上实现高达 80.9% 的准确性。
利用对比损失优化量化网络的方法提高了已经量化的 Vision Transformer 网络的准确率，具有鲁棒性。
探讨了一种基于梯度的后训练量化方法（GPTQ），在选择权重、特征增强、校准集等方面具有鲁棒性，提出了设计更高效、可扩展的 GPTQ 方法的准则。

❓

延伸问答

什么是双均匀量化方法？

双均匀量化方法是一种优化视觉转换器量化准确度的技术，结合了Hessian指导的指标方法。

PTQ4ViT框架的主要优势是什么？

PTQ4ViT框架在ImageNet分类任务上实现了接近无损的预测准确度，8位量化的准确度降低小于0.5%。

后训练量化方法如何提高MobileViT的准确性？

新的后训练量化方法显著提高了MobileViTv1和MobileViTv2的平均准确性，达到7.75%。

SmoothQuant和OPT-m方法的作用是什么？

SmoothQuant with bias term (SQ-b) 和 optimal scaling factor ratio search (OPT-m) 方法在4位和5位量化的ViTs上显著提高了准确度。

基于知识蒸馏的变异感知量化方法有什么优势？

该方法显著提高了经过量化的Vision Transformers模型的准确性和训练效率。

GPTQ方法的设计准则是什么？

GPTQ方法的设计准则包括选择权重、特征增强和校准集等方面的鲁棒性。

🏷️