ADFQ-ViT: 视觉 Transformer 的激活分布友好的后训练量化
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究提出了VAQF框架,用于在FPGA平台上构建量化的ViT模型推理加速器。实验结果显示,使用8位激活量化可满足24帧每秒要求,使用6位激活量化可达到30帧每秒目标。
🎯
关键要点
- 本研究提出了VAQF框架,用于在FPGA平台上构建量化的ViT模型推理加速器。
- VAQF框架可以自动输出所需的量化精度和优化参数设置。
- 实验结果显示,使用8位激活量化可满足24帧每秒要求。
- 使用6位激活量化可达到30帧每秒目标。
➡️