OpenGeMM: A High-Utilization GeMM Accelerator Generator with Lightweight RISC-V Control and Tight Memory Coupling

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

OpenGeMM是一种新型开放源代码加速平台,旨在解决深度神经网络在资源受限边缘设备上的部署问题。该平台通过参数化的Chisel编码GeMM加速器、轻量级RISC-V处理器和紧耦合的多银行临时存储器,实现了高达99.34%的硬件利用率,吞吐量提升3.58至16.40倍,系统效率可达4.68 TOPS/W。

🎯

关键要点

  • OpenGeMM是一种新型开放源代码加速平台,旨在解决深度神经网络在资源受限边缘设备上的部署问题。

  • 该平台结合了参数化的Chisel编码GeMM加速器、轻量级RISC-V处理器和紧耦合的多银行临时存储器。

  • 实验结果显示,OpenGeMM在多种CNN和Transformer工作负载下实现了81.89%至99.34%的硬件利用率。

  • 与现有的Gemmini加速器相比,OpenGeMM在吞吐量上实现了3.58倍至16.40倍的速度提升。

  • 系统效率可达4.68 TOPS/W,显示出其高效利用和易配置的优势。

延伸问答

OpenGeMM的主要功能是什么?

OpenGeMM是一种开放源代码加速平台,旨在解决深度神经网络在资源受限边缘设备上的部署问题。

OpenGeMM如何提高硬件利用率?

OpenGeMM通过参数化的Chisel编码GeMM加速器、轻量级RISC-V处理器和紧耦合的多银行临时存储器实现了高达99.34%的硬件利用率。

与Gemmini加速器相比,OpenGeMM的性能如何?

OpenGeMM在吞吐量上实现了3.58倍至16.40倍的速度提升,显示出其优越的性能。

OpenGeMM的系统效率是多少?

OpenGeMM的系统效率可达4.68 TOPS/W。

OpenGeMM适用于哪些类型的工作负载?

OpenGeMM在多种CNN和Transformer工作负载下表现良好。

OpenGeMM的设计有什么优势?

OpenGeMM结合了高效利用和易配置的优势,适合资源受限的边缘设备。

➡️

继续阅读