光子学加速深度神经网络训练:基于残余数系统的设计
原文中文,约300字,阅读约需1分钟。发表于: 。Mirage 是一种基于残留数系统(RNS)的光子深度神经网络(DNN)训练加速器,通过将 RNS 和光子学相结合,提供高能效、高精度且能够成功训练与 FP32 训练相媲美的 DNNs,相比系统阵列,平均可实现超过 23.8 倍的更快训练速度、32.1 倍的更低能耗与相当或更好的效率 - 功耗比(EDP)在等能端景下,以及 42.8 倍的更低功率消耗在等面积场景下。
本文研究了光子加速器上的图像分割,探讨了适合光子加速器的DNN架构类型,以及执行不同图像分割模型的吞吐量和能效,并讨论了相关权衡。证明了某些分割模型在光子加速器上执行时准确性几乎不会损失,并探究了其鲁棒性的经验推理。比较了不同图像分割工作负载的吞吐量和能耗估计,并讨论了提高光子加速器在计算机视觉任务中应用的挑战和潜在优化方法。