本文介绍了全栈编译器DNNVM,用于深度学习框架。通过优化图表现形式、循环和数据布局等,将复杂的CNN模型转换成有向无环图,并在全计算图中搜索最佳执行策略。在Xilinx ZU9 @330 MHz等设备上实现了与最新算法同等状态的性能,在VGG和ResNet50上达到了最先进的性能。
完成下面两步后,将自动完成登录并继续当前操作。