BriefGPT - AI 论文速递 ·

SNP：结构化神经元级剪枝以保持注意力分数

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

本文探讨了多种针对视觉变换器（ViT）模型的压缩技术，重点在于提高计算效率和减少参数。提出了基于激活的结构化剪枝和自适应剪枝等方法，这些方法显著降低了模型参数和推理时间，同时保持了准确性，适用于移动设备和FPGA，推动了深度学习模型的高效应用。

🎯

通过利用输入令牌稀疏性，提出计算感知的软剪枝框架，显著减少 Vision Transformer 的计算成本，满足移动设备和 FPGA 的资源要求。
提出精细的注意力头修剪方法，解决自监督预训练模型中的模型压缩问题，具有 72% 更少的参数和两倍的推理速度。
提出 GOHSP，一个统一的基于图形和优化的结构化剪枝框架，能够在不损失准确性的情况下，将 ViT-Small 模型的参数减少 40%。
Single-Shot Meta-Pruning 方法可以自适应地剪枝不必要的注意力头，降低精调和推理的开销，选择性剪枝 50% 的注意力头，几乎不影响下游任务性能。
自适应基于激活的结构化裁剪方法，通过迭代性结构化裁剪和自适应剪枝策略，显著减少参数和 FLOPs，而不降低精度。
NViT 方法比以往更高效地利用 ViT 模型的参数，NViT-Base 在 ImageNet-1K 数据集上具备更高的准确率和更低的 FLOPs。
提出适应性结构发展的 SNN 方法，通过神经元修剪和突触再生机制，显著降低网络能耗并优化压缩。
基于随机门和可微松弛 L0 正则化的新型剪枝方法，成功删除大部分注意头而不严重影响性能。
可微的子集剪枝技术通过学习每个头的重要性变量，实现对多头注意力机制的精确控制，表现不亚于以往技术。

❓

计算感知的软剪枝框架利用输入令牌的稀疏性，显著减少 Vision Transformer 的计算成本，适用于移动设备和 FPGA。

GOHSP框架能够在不损失准确性的情况下，将 ViT-Small 模型的参数减少 40%。

Single-Shot Meta-Pruning方法可以自适应地剪枝不必要的注意力头，降低精调和推理的开销，选择性剪枝 50% 的注意力头，几乎不影响下游任务性能。

该方法通过迭代性结构化裁剪和自适应剪枝策略，显著减少参数和 FLOPs，而不降低精度。

NViT方法比以往更高效地利用 ViT 模型的参数，NViT-Base 在 ImageNet-1K 数据集上具备更高的准确率和更低的 FLOPs。

可微的子集剪枝技术通过学习每个头的重要性变量，实现对多头注意力机制的精确控制，表现不亚于以往技术。

🏷️