【TVM Tutorial】Reduction (Reduce)
原文英文,约3900词,阅读约需15分钟。发表于: 。除了te.sumtvm.te.min和tvm.te.max等内置规约操作外,还可以通过定义交换规约操作。本教程演示了如何规约 schedule。用 reduce_axis 描述规约。如需并行性(parallelism),用 rfactor 来分解轴。通过定义新的规约操作。
Apache TVM 是一个支持多种硬件的深度学习编译框架。本文介绍了 TVM 中的规约操作,包括使用 te.reduce_axis 声明规约轴和 te.sum 计算总和。通过示例展示了行求和、拆分规约轴、绑定 GPU 线程等操作,并介绍了 rfactor 原语进行规约重写及卷积操作的描述。TVM 还提供 te.comm_reducer 用于定义自定义规约操作。