基于FPGA的平铺矩阵乘法加速器设计与实现,用于Xilinx KV260 SoM上的Transformer自注意力
📝
内容提要
本研究针对Transformer模型中多头自注意力模块的关键计算瓶颈,提出了一种针对Xilinx KV260板载FPGA的平铺矩阵乘法加速器。该加速器通过持久的片上存储、双层平铺和类似脉动的展开计算引擎显著提升了计算速度和能效,基准测试显示在矩阵计算中可实现高达7倍的速度提升。
🏷️
标签
➡️