本文介绍了多种视觉变换器的后训练量化方法,如PTQ4ViT、MGRQ和RepQuant,旨在提高量化准确度并降低计算需求。这些方法在ImageNet等任务上实现了接近无损的性能提升,尤其在低位量化下表现优异,显著提高了模型的实用性和效率。
本文提出了多种后训练量化方法(如SQ-b、OPT-m和MPTQ-ViT),在ImageNet数据集上显著提高了视觉变换器(ViTs)的准确性。这些方法有效降低了内存和计算成本,适用于移动设备,并在多个基准模型上验证了其有效性。
完成下面两步后,将自动完成登录并继续当前操作。