BriefGPT - AI 论文速递 ·

Quasar-ViT: 面向硬件的量化感知架构搜索视觉 Transformer

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文调查了视觉变换器（ViTs）的模型量化与硬件加速，提出了VAQF框架以在FPGA上加速量化ViT模型，满足帧速率要求。研究还介绍了基于知识蒸馏的量化方法，提升了模型准确性和训练效率，并提出了I-ViT整数量化方案，减少模型复杂性，适用于边缘设备。

🎯

❓

VAQF框架可以在FPGA平台上为量化的ViT模型构建推理加速器，满足帧速率要求。

通过基于知识蒸馏的变异感知量化方法，可以显著提高视觉变换器模型的准确性和训练效率。

I-ViT整数量化方案通过整数算术和位移减少模型复杂性，适用于边缘设备，并且在准确率上与浮点基线相当。

在使用8位激活量化时，满足24帧每秒的帧速率要求，使用6位激活量化时可达到30帧每秒。

ViT-1.58b模型通过三值量化平衡效率和准确性，显著减少存储和计算成本。

文章讨论了量化ViTs的硬件加速的重要性以及未来的挑战和研究方向。

🏷️