可解释的人工智能指导的多节点收缩阵列高效近似深度神经网络生成

📝

内容提要

本研究解决了近似深度神经网络在使用近似乘法器时,CPU和GPU上模拟效率低下的问题。提出的XAI-Gen方法利用新兴硬件加速器的分析模型与可解释人工智能,快速识别近似中的非关键层,发现适合的近似乘法器。结果表明,XAI-Gen在仅有1-2%准确率损失的情况下,能实现高达7倍的能耗降低,且通过XAI-NAS的案例研究,能效提升达到40%,执行时间减少可达5倍,相较于现有最先进的生成方法。

🏷️

标签

➡️

继续阅读