BriefGPT - AI 论文速递 ·

视觉 Transformer 后训练量化的错误减少

💡 原文中文，约2100字，阅读约需5分钟。

📝

内容提要

本文介绍了多种视觉变换器的后训练量化方法，如PTQ4ViT、MGRQ和RepQuant，旨在提高量化准确度并降低计算需求。这些方法在ImageNet等任务上实现了接近无损的性能提升，尤其在低位量化下表现优异，显著提高了模型的实用性和效率。

🎯

关键要点

提出了双均匀量化方法和Hessian指导的指标方法，优化视觉转换器的量化准确度。
PTQ4ViT框架在ImageNet分类任务上实现了接近无损的预测准确度，8位量化准确度降低小于0.5%。
MGRQ（混合粒度重构量化）通过引入全局和本地监督，提升了PTQ的性能，尤其在低位量化下表现稳健。
提出的后训练量化方法显著提高了MobileViTv1和MobileViTv2的平均准确性，达到7.75%。
实例感知分组量化技术（IGQ-ViT）动态分割激活图通道，最小化量化模型与全精度模型之间的差异。
结合低秩近似和量化的方法，实现了几乎无失真的W4A8量化，减少了计算资源需求。
NoisyQuant通过添加均匀噪声偏差显著降低量化误差，提升视觉转换器的后训练量化性能。
ADFQ-ViT框架改进了视觉转换器中的离散化，显著提高了4位情况下的性能。
RepQuant框架通过量化推理解耦合，确保准确的量化和高效的推理，取得了显著的性能优势。

❓

延伸问答

什么是后训练量化（PTQ）？

后训练量化（PTQ）是一种高效的模型压缩技术，通过使用小的校准样本集对预训练的全精度模型进行量化，而无需重新训练。

PTQ4ViT框架在量化准确度上有什么优势？

PTQ4ViT框架在ImageNet分类任务上实现了接近无损的预测准确度，8位量化的准确度降低小于0.5%。

MGRQ方法是如何提升量化性能的？

MGRQ通过引入全局和本地监督，构建优化的块重构模型，显著提升了PTQ的性能，尤其在低位量化下表现稳健。

NoisyQuant的作用是什么？

NoisyQuant通过添加均匀噪声偏差显著降低量化误差，提升视觉转换器的后训练量化性能。

RepQuant框架的创新点是什么？

RepQuant框架通过量化推理解耦合，确保准确的量化和高效的推理，取得了显著的性能优势。

在低位量化下，哪些方法表现优异？

MGRQ和PTQ4ViT在低位量化下表现优异，尤其在量化准确度和性能提升方面。

🏷️

标签

MGRQ PTQ4ViT RepQuant transformer 后训练量化视觉变换器

➡️

继续阅读

WAIC 2026 | 摩尔线程首次公开多项训练推理实践成果，三大“AI工厂”持续释放算力价值
TÜV南德深度参与2026世界人工智能大会
(全球TMT 2026年07月20日讯)7月17至18日，国际第三方检测认证机构TÜV南德意志集团深度参与20 […]
汇正财经AI基因图谱智能体入选国家级案例
(全球TMT 2026年07月20日讯)7月17日至20日，2026世界人工智能大会暨人工智能全球治理高级别会 […]
IBM和红帽正式推出Lightwell
(全球TMT 2026年07月20日讯)IBM和红帽近日正式推出Lightwell，通过两项服务提供规模化的自 […]
从“能说话”到“会表达”：Qwen-Audio-3.0-TTS 发布
Qwen-Audio-3.0-TTS 实时语音合成模型发布。本次发布包含两个版本：本次更新，我们把精力放在了开发者在生产环境中真正会遇到的四个问题上：更...
移远通信端侧AI大模型解决方案迎来全面升级
(全球TMT 2026年07月20日讯)在WAIC 2026（世界人工智能大会）期间，移远通信宣布其端侧AI大 […]