深度网络中使用较低位宽累加器实现更廉价的推理
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
最新研究提出了一种称为A2Q的量化感知训练方法,通过约束模型权重以安全地使用目标累加器位宽。引入改进的上界和新的权重初始化策略形成A2Q+,实验证实A2Q+改善了累加器位宽和模型准确性之间的权衡。
🎯
关键要点
- 量化技术通过限制权重和激活函数的精度来降低神经网络推理成本。
- 降低累加器的精度可以提高硬件效率,但存在数值溢出的风险。
- 最新研究提出了累加器感知量化(A2Q)方法,通过约束模型权重以安全使用目标累加器位宽。
- A2Q方法存在过于严格的约束和亚优化的权重初始化策略,导致多余的量化误差。
- 为了解决这些问题,引入了改进的上界和新的权重初始化策略,形成A2Q+。
- 实验证实A2Q+改善了累加器位宽和模型准确性之间的权衡。
➡️