针对 GPU 上的分层 N:M 稀疏置换的高效实现

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

利用NVIDIA的Sparse Tensor Core技术,N:M稀疏剪枝是压缩深度神经网络的一种强大技术。通过引入每个排列阶段中的策略,包括通道采样、聚类和分配来克服局部最小值,并通过独立层排列的GPU内核在执行HiNM稀疏网络时进行排列。

🎯

关键要点

  • 利用NVIDIA的Sparse Tensor Core技术进行N:M稀疏剪枝
  • N:M稀疏剪枝是一种压缩深度神经网络的强大技术
  • 该方法利用硬件支持的稀疏索引,采用细粒度稀疏以维持模型准确性
  • 最小化与不规则数据访问相关的开销
  • 介绍了一种针对HiNM稀疏性设计的通道排列方法,称为gyro-permutation
  • 通过通道采样、聚类和分配策略克服局部最小值
  • 在执行HiNM稀疏网络时,通过独立层排列的GPU内核进行排列
🏷️

标签

➡️

继续阅读