小红花·文摘

Apache TVM 是一个支持 CPU 和 GPU 的深度学习编译框架。本文介绍如何结合「Pipeline Executor」与 Relay 创建和拆分简单神经网络。通过配置子图和目标，使用 CUTLASS 构建，实现两个子图的异步或同步运行，并验证输出结果。