MimiQ:视觉 Transformer 的低比特数据无关量化

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本研究提出了一种名为VAQF的框架,可在FPGA平台上构建量化的ViT模型推理加速器,并自动输出所需的量化精度和优化参数设置,以满足帧速率要求。实验结果表明,使用8位激活量化可满足24帧每秒的要求,使用6位激活量化可达到30帧每秒的目标。

🎯

关键要点

  • 本研究提出了VAQF框架,用于在FPGA平台上构建量化的ViT模型推理加速器。

  • VAQF框架能够自动输出所需的量化精度和优化参数设置。

  • 该框架旨在满足硬件要求下的帧速率。

  • 实验结果显示,使用8位激活量化可满足24帧每秒的要求。

  • 使用6位激活量化可达到30帧每秒的目标。

➡️

继续阅读