本研究提出了一种新型模拟加速器架构,旨在优化AI/ML训练负载,解决能效与性能的矛盾。该架构通过数域电路和亚阈值MOS技术,在功耗和晶体管面积上显著优于数字实现,实验结果接近理想行为,推动高能效模拟人工智能硬件的发展。
该研究使用RNS开发了一种基于方法的模拟加速器,可以在只使用6位精度的数据转换器的情况下,实现优于FP32精度的99%以上的DNN推断和高效训练。提出了一种容错数据流,利用冗余RNS纠错码保护计算,以应对模拟加速器中的噪声和误差。
完成下面两步后,将自动完成登录并继续当前操作。