针对 GPU 上的分层 N:M 稀疏置换的高效实现
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
利用NVIDIA的Sparse Tensor Core技术,N:M稀疏剪枝是压缩深度神经网络的一种强大技术。通过引入每个排列阶段中的策略,包括通道采样、聚类和分配来克服局部最小值,并通过独立层排列的GPU内核在执行HiNM稀疏网络时进行排列。
🎯
关键要点
- 利用NVIDIA的Sparse Tensor Core技术进行N:M稀疏剪枝
- N:M稀疏剪枝是一种压缩深度神经网络的强大技术
- 该方法利用硬件支持的稀疏索引,采用细粒度稀疏以维持模型准确性
- 最小化与不规则数据访问相关的开销
- 介绍了一种针对HiNM稀疏性设计的通道排列方法,称为gyro-permutation
- 通过通道采样、聚类和分配策略克服局部最小值
- 在执行HiNM稀疏网络时,通过独立层排列的GPU内核进行排列
🏷️
标签
➡️