本研究提出了一种NPU向量提前执行(NVR)机制,旨在解决深度神经网络中的缓存失效问题。NVR通过轻量级硬件设计,实现了90%的缓存失效减少和4倍的速度提升。
完成下面两步后,将自动完成登录并继续当前操作。