高效边缘人工智能:使用Gemmini加速器在FPGA上部署卷积神经网络
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了在边缘设备上部署卷积神经网络(CNN)的复杂性和劳动强度问题。通过开发一个端到端的工作流程,利用Gemmini加速器和开源软件优化部署过程,研究显示在Xilinx ZCU102 FPGA上部署YOLOv7模型可实现实时性能和36.5 GOP/s/W的能效表现,显著优于其他嵌入式硬件设备。此方案在交通监控场景中的应用展示了其广泛的潜在影响。
本研究通过开发端到端工作流程,利用Gemmini加速器和开源软件优化部署过程,解决了在边缘设备上部署卷积神经网络的复杂性和劳动强度问题。研究结果表明,在Xilinx ZCU102 FPGA上部署YOLOv7模型可实现实时性能和高能效表现,显著优于其他嵌入式硬件设备。此方案在交通监控场景中的应用展示了其广泛的潜在影响。