视觉变换器精确低位后训练量化的渐进细到粗重建
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种渐进细到粗重建(PFCR)方法,以解决视觉变换器(ViTs)在后训练量化(PTQ)中低位量化性能下降的问题。该方法使3位量化的ViT-B模型Top-1准确率显著提升至75.61%。
🎯
关键要点
- 本研究提出了一种渐进细到粗重建(PFCR)方法。
- 该方法解决了视觉变换器(ViTs)在后训练量化(PTQ)中低位量化性能下降的问题。
- PFCR方法通过定义多头自注意力和多层感知器模块作为最细重建单元。
- 结合逐步重建策略,显著提升了低位量化视觉变换器的表现。
- 在3位量化的ViT-B模型中,Top-1准确率达到了75.61%。
- 该方法展现了优越的性能和广泛的应用潜力。
➡️