高效神经网络训练与压缩的自动联合结构剪枝和量化
📝
内容提要
本研究针对目前联合剪枝与量化方法在工程复杂性、黑箱优化及架构通用性等方面的不足,提出了一种新的框架GETA,能够自动高效地对深度神经网络进行联合结构剪枝和量化感知训练。实验结果表明,GETA在卷积神经网络和变换器架构上均能实现与现有方法竞争甚至更优的性能,展示了该方法对网络压缩质量的显著提升潜力。
🏷️
标签
➡️