视觉变换器精确低位后训练量化的渐进细到粗重建

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种渐进细到粗重建(PFCR)方法,以解决视觉变换器(ViTs)在后训练量化(PTQ)中低位量化性能下降的问题。该方法使3位量化的ViT-B模型Top-1准确率显著提升至75.61%。

🎯

关键要点

  • 本研究提出了一种渐进细到粗重建(PFCR)方法。
  • 该方法解决了视觉变换器(ViTs)在后训练量化(PTQ)中低位量化性能下降的问题。
  • PFCR方法通过定义多头自注意力和多层感知器模块作为最细重建单元。
  • 结合逐步重建策略,显著提升了低位量化视觉变换器的表现。
  • 在3位量化的ViT-B模型中,Top-1准确率达到了75.61%。
  • 该方法展现了优越的性能和广泛的应用潜力。
➡️

继续阅读