Apache TVM 是一个支持 CPU 和 GPU 的深度学习编译框架。本文介绍如何结合「Pipeline Executor」与 Relay 创建和拆分简单神经网络。通过配置子图和目标,使用 CUTLASS 构建,实现两个子图的异步或同步运行,并验证输出结果。
完成下面两步后,将自动完成登录并继续当前操作。