OpenGeMM: A High-Utilization GeMM Accelerator Generator with Lightweight RISC-V Control and Tight Memory Coupling
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
OpenGeMM是一种新型开放源代码加速平台,旨在解决深度神经网络在资源受限边缘设备上的部署问题。该平台通过参数化的Chisel编码GeMM加速器、轻量级RISC-V处理器和紧耦合的多银行临时存储器,实现了高达99.34%的硬件利用率,吞吐量提升3.58至16.40倍,系统效率可达4.68 TOPS/W。
🎯
关键要点
-
OpenGeMM是一种新型开放源代码加速平台,旨在解决深度神经网络在资源受限边缘设备上的部署问题。
-
该平台结合了参数化的Chisel编码GeMM加速器、轻量级RISC-V处理器和紧耦合的多银行临时存储器。
-
实验结果显示,OpenGeMM在多种CNN和Transformer工作负载下实现了81.89%至99.34%的硬件利用率。
-
与现有的Gemmini加速器相比,OpenGeMM在吞吐量上实现了3.58倍至16.40倍的速度提升。
-
系统效率可达4.68 TOPS/W,显示出其高效利用和易配置的优势。
❓
延伸问答
OpenGeMM的主要功能是什么?
OpenGeMM是一种开放源代码加速平台,旨在解决深度神经网络在资源受限边缘设备上的部署问题。
OpenGeMM如何提高硬件利用率?
OpenGeMM通过参数化的Chisel编码GeMM加速器、轻量级RISC-V处理器和紧耦合的多银行临时存储器实现了高达99.34%的硬件利用率。
与Gemmini加速器相比,OpenGeMM的性能如何?
OpenGeMM在吞吐量上实现了3.58倍至16.40倍的速度提升,显示出其优越的性能。
OpenGeMM的系统效率是多少?
OpenGeMM的系统效率可达4.68 TOPS/W。
OpenGeMM适用于哪些类型的工作负载?
OpenGeMM在多种CNN和Transformer工作负载下表现良好。
OpenGeMM的设计有什么优势?
OpenGeMM结合了高效利用和易配置的优势,适合资源受限的边缘设备。
➡️