Archtree: 基于实时树结构探索的深度神经网络低延迟裁剪

📝

内容提要

Archtree 是一种新的基于延迟驱动的 DNN 结构修剪方法,通过并行地在树形结构中探索多个候选修剪子模型,实时估计目标硬件的延迟,从而更好地适应延迟预算并保持原始模型准确性。

🏷️

标签

➡️

继续阅读