深度神经网络加速器故障定位的监视器部署

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该文章介绍了一种高度紧凑的运行时监控方法,可以从少量隐藏层中提取选择性知识,并有效地检测静默数据损坏。通过在网络层中放置量化标记,准确估计当前推断的异常情况,实现对正常和异常行为的分类。该方法在检测上具有高精确度和召回率,并且计算开销最小,有助于模型的可解释性。

🎯

关键要点

  • 提出了一种高度紧凑的运行时监控方法。
  • 该方法可以从少量隐藏层中提取选择性知识。
  • 有效检测静默数据损坏,来源于硬件内存和输入故障。
  • 通过在网络层中放置量化标记,准确估计异常情况。
  • 实现对正常和异常行为的可解释性分类。
  • 检测精确度高达96%,召回率高达98%。
  • 计算开销最小,仅为非监督推断时间的0.3%。
  • 该方法有助于模型的可解释性。
🏷️

标签

➡️

继续阅读