BETA: 边缘二值化能效优化的 Transformer 加速器
原文中文,约300字,阅读约需1分钟。发表于: 。通过优化计算顺序和引入高度并行性和高速的 QMM 引擎,本文提出了一种基于二进制 Transformer 的能效较高的加速器 BETA,实验证明,BETA 在边缘部署中能够实现 174 GOPS/W 的平均能效,比之前基于 FPGA 的加速器高出 1.76~21.92 倍,显示了 BETA 在边缘 Transformer 加速方面的巨大潜力。
该论文提出了ITA加速器架构,用于高效推理,表现出色的能效和面积效率。