面向同质边缘设备的硬件感知深度神经网络压缩 本研究针对在同质边缘设备上部署深度神经网络(DNN)时,设备性能差异的问题,提出了一种名为同质设备感知剪枝(HDAP)的硬件感知压缩框架。该框架通过将设备分为若干个聚类,并采用替代性评估的方法,显著提升了压缩模型在所有设备上的平均性能,实验结果表明,HDAP在推理延迟方面优于现有方法,具有良好的可扩展性与高性能。 硬件 神经网络