LAPP:基于分层自适应渐进修剪的卷积神经网络压缩算法
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了一种基于辅助门控机制的结构化网络剪枝方法,通过块级剪枝的投票策略解决移动设备上使用卷积神经网络时的成本问题。经过知识蒸馏的三阶段训练计划,该方法在分类任务中取得了最先进的压缩性能,可以与其他剪枝方法协同集成,减少了超过93%的浮点运算。
🎯
关键要点
- 介绍了一种基于辅助门控机制的结构化网络剪枝方法。
- 通过给主干网中的块分配重要性标记,提出块级剪枝的投票策略。
- 解决了移动设备上使用卷积神经网络时的成本问题。
- 采用知识蒸馏的三阶段训练计划,提高了模型性能,实现更好的压缩率。
- 实验证明该方法在分类任务中取得了最先进的压缩性能。
- 提供预训练模型,使得该方法可以与其他剪枝方法协同集成。
- 实现比未剪枝模型更优异的性能,减少了超过93%的浮点运算。
➡️