ARQ:一种适用于准确且可证明鲁棒性的混合精度量化框架
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了深度神经网络(DNN)在资源有限的计算平台上执行时的量化鲁棒性不足的问题。提出的ARQ方法通过强化学习寻找到既准确又鲁棒的DNN量化方案,同时利用随机平滑技术指导搜索过程,保证了分类器的清洁准确性和认证鲁棒性。实验结果表明,ARQ在多个基准测试中优于传统量化技术,甚至在许多情况下与原始浮点权重的DNN性能相当,但仅需1.5%的指令集。
本研究提出了一种ARQ方法,结合强化学习和随机平滑技术,解决了深度神经网络在资源有限平台上的量化鲁棒性问题。实验结果显示,ARQ在多个基准测试中优于传统量化技术,性能接近原始DNN,且仅需1.5%的指令集。