一个基于机器学习加速器的开源全栈优化框架
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
参数化机器学习加速器通过硬件加速深度神经网络和非神经网络的机器学习算法进行设计空间探索。采用物理设计驱动的学习预测框架,结合功耗、性能和面积分析以及前端性能模拟,实现了对后端 PPA 和运行时能耗等系统指标的真实估计。引入完全自动化的设计空间探索技术,通过自动搜索来优化后端和系统指标。实验结果表明,该方法在两种深度学习加速器平台的ASIC实现中,能准确地预测后端PPA和系统指标。
🎯
关键要点
- 参数化机器学习加速器通过硬件加速深度神经网络和非神经网络的机器学习算法进行设计空间探索。
- 采用物理设计驱动的学习预测框架,结合功耗、性能和面积分析以及前端性能模拟。
- 实现了对后端 PPA 和运行时能耗等系统指标的真实估计。
- 引入完全自动化的设计空间探索技术,通过自动搜索优化后端和系统指标。
- 实验结果表明,该方法在两种深度学习加速器平台的ASIC实现中,能准确预测后端PPA和系统指标。
- 无论是商业 12 纳米工艺还是研究导向的 45 纳米工艺,平均预测误差为7%或更低。
➡️