GCV-Turbo: 基于 FPGA 的 GNN 计算机视觉任务的端到端加速
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文介绍了全栈编译器DNNVM,用于深度学习框架。通过优化图表现形式、循环和数据布局等,将复杂的CNN模型转换成有向无环图,并在全计算图中搜索最佳执行策略。在Xilinx ZU9 @330 MHz等设备上实现了与最新算法同等状态的性能,在VGG和ResNet50上达到了最先进的性能。
🎯
关键要点
- 提出了全栈编译器DNNVM,用于深度学习框架。
- 通过优化图表现形式、循环和数据布局,将复杂的CNN模型转换成有向无环图(XGraph)。
- 利用启发式子图同构算法枚举所有潜在的融合机会。
- 在全计算图中搜索执行策略的最佳选择。
- 在Xilinx ZU9 @330 MHz等设备上实现了与最新算法同等状态的性能。
- 在VGG和ResNet50上达到了最先进的性能。
➡️