SparseByteNN:一种基于细粒度分组稀疏性的新型移动推理加速框架
💡
原文中文,约700字,阅读约需2分钟。
📝
内容提要
SparseByteNN是一种新颖的移动推理加速框架,通过利用细粒度的内核稀疏性实现实时执行和高准确性。实验结果表明,SparseByteNN相对于密集版本获得了1.27倍的加速,并相对于最先进的稀疏推理引擎MNN获得了1.29倍的加速,准确性略有下降。
🎯
关键要点
- SparseByteNN是一种新颖的移动推理加速框架。
- 该框架通过细粒度的内核稀疏性实现实时执行和高准确性。
- SparseByteNN包括两个部分:细粒度的内核稀疏模式和与稀疏模式共同优化的推理引擎。
- 细粒度的内核稀疏模式为不同操作器设计了多种稀疏模式,结合整体网络重新排列策略实现高压缩率和高精度。
- SparseByteNN通过引入高效稀疏内核纠正了FLOPs减少与真实世界效率提升之间的误解。
- 实验结果显示,SparseByteNN在30%稀疏的MobileNet-v1上相对于密集版本获得了1.27倍的加速。
- 相对于最先进的稀疏推理引擎MNN,SparseByteNN获得了1.29倍的加速,准确性略有下降0.224%。
- SparseByteNN的源代码将在指定的URL上提供。
➡️