Efficient Synaptic Delay Implementation in Digital Event-Driven AI Accelerators

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究探讨了神经网络模型中的突触延迟参数化问题,提出了一种共享循环延迟队列(SCDQ)硬件结构,展示了在内存扩展性和算法与硬件协同优化方面的优势,提升了延迟、面积和能耗效率。

🎯

关键要点

  • 神经网络模型中的突触延迟参数化问题尚未深入探讨。
  • 参数化延迟的模型在简化、缩小、稀疏化及能源效率方面优于非参数化模型。
  • 提出了一种新颖的硬件结构——共享循环延迟队列(SCDQ)。
  • 共享循环延迟队列在内存扩展性方面表现更好。
  • SCDQ在算法与硬件的协同优化中更具可行性。
  • SCDQ提升了延迟、面积和每次推理的能耗效率。
➡️

继续阅读