BriefGPT - AI 论文速递 ·

动态拆分：一种能源意识推断的硬件-软件协同设计框架

💡 原文中文，约1100字，阅读约需3分钟。

📝

内容提要

该论文提出了基于边缘计算的DNN协同推理框架Edgent，旨在降低计算延迟，实现低延迟边缘智能处理。研究探讨了设备与边缘的联合优化，提出动态拆分计算模型和新的剪枝框架，以提高推理效率并降低能耗。实验结果表明，该框架显著减少了推理延迟和能耗，推动了边缘设备在AI推理中的应用。

🎯

🔎

边缘计算通过将数据处理移至靠近数据源的地方，显著降低了计算延迟。这种方法特别适合实时应用，如智能监控和自动驾驶，能够提高响应速度和用户体验。

动态拆分计算模型利用深度神经网络中的瓶颈，避免了重新训练，提升了推理速度。这一创新使得在资源受限的边缘设备上部署深度学习模型变得更加高效，具有重要的实用价值。

在边缘设备上进行深度学习推理时，能耗管理至关重要。研究提出的All-in-One剪枝框架和PolyThrottle解决方案，旨在优化能耗与性能之间的平衡，降低能耗的同时保持推理速度的稳定性。

❓

Edgent框架旨在降低计算延迟，实现低延迟的边缘智能处理。

动态拆分计算模型通过利用深度神经网络中的瓶颈，避免了重新训练和超参数优化，从而提升推理速度。

研究通过减少DNN冗余度来平衡资源消耗与模型准确度，特别是在资源受限的边缘设备上。

All-in-One剪枝框架旨在应对动态功率管理带来的不稳定推理速度性能，通过重新配置模型以适应特定的执行频率和电压。

DVFO框架通过共同优化边缘设备的CPU、GPU和内存频率，以及特征映射的云服务器卸载，改善了能源效率和推理延迟。

PolyThrottle解决方案通过约束性贝叶斯优化，能够在满足应用约束条件的同时，将能耗降低36%。

🏷️