BriefGPT - AI 论文速递 ·

双向比特级稀疏性用于深度学习加速

💡 原文中文，约1300字，阅读约需3分钟。

📝

内容提要

本研究探讨了稀疏性对深度神经网络设计的影响，表明粗粒度稀疏性在保持精度的同时提高了压缩率和设计效率。提出了掩码多样性度量、比特级稀疏量化法和N:M稀疏性训练等新方法，显示出在模型压缩和加速方面的潜力，尤其在FPGA硬件上表现优异。

🎯

❓

粗粒度稀疏性在保持精度的前提下，能够获得更好的压缩率和更高效的硬件设计，显著提高深度神经网络的设计效率和预测精度。

BSQ通过可微比特稀疏正则化，将量化权重的每一位视为独立可训练变量，实现动态精度降低，从而在多个模型上获得更高的准确性和比特削减。

N:M稀疏性训练通过修剪掩码衰减和稀疏结构衰减的方法，能够在保持模型精度的同时减少训练计算量，提升训练效率。

通过在预训练模型的卷积和全连接层参数中将特定区域置零，可以实现权重块稀疏性，从而提高推理速度，减小内存占用和计算负载。

掩码多样性度量方法用于降低深度神经网络的内存占用，并引入可转置细粒度稀疏掩码，优化网络结构。

在FPGA加速器上，采用N:M稀疏DNN训练方案可以实现显著的加速和能效提升，训练吞吐量提高了2.97至25.22倍。

🏷️