MimiQ:视觉 Transformer 的低比特数据无关量化
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究提出了一种名为VAQF的框架,可在FPGA平台上构建量化的ViT模型推理加速器,并自动输出所需的量化精度和优化参数设置,以满足帧速率要求。实验结果表明,使用8位激活量化可满足24帧每秒的要求,使用6位激活量化可达到30帧每秒的目标。
🎯
关键要点
-
本研究提出了VAQF框架,用于在FPGA平台上构建量化的ViT模型推理加速器。
-
VAQF框架能够自动输出所需的量化精度和优化参数设置。
-
该框架旨在满足硬件要求下的帧速率。
-
实验结果显示,使用8位激活量化可满足24帧每秒的要求。
-
使用6位激活量化可达到30帧每秒的目标。
➡️