联合修剪与通道混合精度量化用于高效的深度神经网络
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
该论文提出了一种混合精度搜索方法,通过可微分搜索算法和硬件感知优化算法,在不同硬件平台上优化混合精度配置,减少模型大小和延迟,保持准确性。
🎯
关键要点
-
提出了一种混合精度搜索方法。
-
该方法结合了可微分搜索算法和硬件感知优化算法。
-
旨在优化特定硬件上的混合精度配置。
-
目标是减少模型大小和延迟,同时保持统计准确性。
-
在 MobileNetV1 和 MobileNetV2 上进行了评估。
-
在多核 RISC-V 微控制器平台上实现了高达 28.6% 的端到端延迟降低。
-
在没有对子字节算术支持的系统上也能实现加速。
-
在减少二进制运算次数方面表现出优越性。
➡️