该研究提出了一种新的度量方法,用于降低DNN的内存占用。同时介绍了一种新型可转置细粒度稀疏掩码,并使用最小成本流问题来寻找最优的可转置掩码。此外,还提出了一种将无结构稀疏模型转换为N:M细粒度块稀疏模型的方法。
完成下面两步后,将自动完成登录并继续当前操作。