动态拆分:一种能源意识推断的硬件-软件协同设计框架

💡 原文中文,约1100字,阅读约需3分钟。
📝

内容提要

该论文提出了基于边缘计算的DNN协同推理框架Edgent,旨在降低计算延迟,实现低延迟边缘智能处理。研究探讨了设备与边缘的联合优化,提出动态拆分计算模型和新的剪枝框架,以提高推理效率并降低能耗。实验结果表明,该框架显著减少了推理延迟和能耗,推动了边缘设备在AI推理中的应用。

🎯

关键要点

  • 该论文提出了基于边缘计算的DNN协同推理框架Edgent,旨在降低计算延迟,实现低延迟边缘智能处理。
  • 研究探讨了设备与边缘的联合优化,包括在线模型分裂和模型放置决策,以最小化能量和时间成本。
  • 提出了动态拆分计算模型,通过利用深度神经网络中的瓶颈,避免了重新训练和超参数优化,提升推理速度。
  • 研究了在资源受限的边缘设备上部署DNN的优化问题,旨在平衡资源消耗与模型准确度。
  • 提出了全新的剪枝框架All-in-One,以应对动态功率管理带来的不稳定推理速度性能。
  • 提出基于DVFS的边缘-云协同推理框架DVFO,改善不同DNN模型在边缘-云网络条件下的能源效率和推理延迟。
  • 通过约束性贝叶斯优化,提出PolyThrottle解决方案,降低能耗36%。

延伸问答

Edgent框架的主要目标是什么?

Edgent框架旨在降低计算延迟,实现低延迟的边缘智能处理。

动态拆分计算模型是如何提高推理速度的?

动态拆分计算模型通过利用深度神经网络中的瓶颈,避免了重新训练和超参数优化,从而提升推理速度。

该研究如何平衡资源消耗与模型准确度?

研究通过减少DNN冗余度来平衡资源消耗与模型准确度,特别是在资源受限的边缘设备上。

All-in-One剪枝框架的作用是什么?

All-in-One剪枝框架旨在应对动态功率管理带来的不稳定推理速度性能,通过重新配置模型以适应特定的执行频率和电压。

DVFO框架如何改善能源效率和推理延迟?

DVFO框架通过共同优化边缘设备的CPU、GPU和内存频率,以及特征映射的云服务器卸载,改善了能源效率和推理延迟。

PolyThrottle解决方案的主要贡献是什么?

PolyThrottle解决方案通过约束性贝叶斯优化,能够在满足应用约束条件的同时,将能耗降低36%。

➡️

继续阅读