SparseByteNN:一种基于细粒度分组稀疏性的新型移动推理加速框架

💡 原文中文,约700字,阅读约需2分钟。
📝

内容提要

SparseByteNN是一种新颖的移动推理加速框架,通过利用细粒度的内核稀疏性实现实时执行和高准确性。实验结果表明,SparseByteNN相对于密集版本获得了1.27倍的加速,并相对于最先进的稀疏推理引擎MNN获得了1.29倍的加速,准确性略有下降。

🎯

关键要点

  • SparseByteNN是一种新颖的移动推理加速框架。
  • 该框架通过细粒度的内核稀疏性实现实时执行和高准确性。
  • SparseByteNN包括两个部分:细粒度的内核稀疏模式和与稀疏模式共同优化的推理引擎。
  • 细粒度的内核稀疏模式为不同操作器设计了多种稀疏模式,结合整体网络重新排列策略实现高压缩率和高精度。
  • SparseByteNN通过引入高效稀疏内核纠正了FLOPs减少与真实世界效率提升之间的误解。
  • 实验结果显示,SparseByteNN在30%稀疏的MobileNet-v1上相对于密集版本获得了1.27倍的加速。
  • 相对于最先进的稀疏推理引擎MNN,SparseByteNN获得了1.29倍的加速,准确性略有下降0.224%。
  • SparseByteNN的源代码将在指定的URL上提供。
➡️

继续阅读