GCV-Turbo: 基于 FPGA 的 GNN 计算机视觉任务的端到端加速

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

本文介绍了全栈编译器DNNVM,用于深度学习框架。通过优化图表现形式、循环和数据布局等,将复杂的CNN模型转换成有向无环图,并在全计算图中搜索最佳执行策略。在Xilinx ZU9 @330 MHz等设备上实现了与最新算法同等状态的性能,在VGG和ResNet50上达到了最先进的性能。

🎯

关键要点

  • 提出了全栈编译器DNNVM,用于深度学习框架。
  • 通过优化图表现形式、循环和数据布局,将复杂的CNN模型转换成有向无环图(XGraph)。
  • 利用启发式子图同构算法枚举所有潜在的融合机会。
  • 在全计算图中搜索执行策略的最佳选择。
  • 在Xilinx ZU9 @330 MHz等设备上实现了与最新算法同等状态的性能。
  • 在VGG和ResNet50上达到了最先进的性能。
➡️

继续阅读