一种用于模拟内存计算的精密优化定点近存数字处理单元

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文提出了一种新颖的端到端方法,用于在微控制器上部署低误差的深度神经网络。通过混合低位宽压缩和整数运算,摆脱了资源受限边缘设备的内存和计算限制。实验结果表明,相比之前的实现,精度提高了8%。

🎯

关键要点

  • 提出了一种新颖的端到端方法,用于在微控制器上部署低误差的深度神经网络。
  • 通过混合低位宽压缩和整数运算,解决了资源受限边缘设备的内存和计算限制。
  • 结合8、4或2位均匀量化,确定每个激活和权重张量的最小位精度。
  • 采用量化感知的重训练,将虚假量化图转换为整数推理模型。
  • 使用整数通道归一化 (ICN) 图层,将模型部署到仅有2MB FLASH存储器和512kB RAM的设备上。
  • 基于STM32H7微控制器的混合精度MobilenetV1家族网络的延迟-精度评估结果显示,Top1精度提高了8%,达到了68%。
🏷️

标签

➡️

继续阅读