HyperAI超神经 ·

【TVM 教程】为 x86 CPU 自动调优卷积网络

💡 原文中文，约10600字，阅读约需26分钟。

📝

内容提要

Apache TVM 是一个支持 CPU 和 GPU 的深度学习编译框架。本文以 resnet-18 为例，介绍了如何为 x86 CPU 优化卷积神经网络，包括网络定义、调优设置和性能评估。

🎯

🔎

本教程不支持 Windows 或最新版本的 macOS，用户需在其他操作系统上运行。这一限制可能影响开发者的选择，尤其是在使用主流操作系统的情况下。建议用户提前确认环境兼容性，以避免不必要的时间浪费。

在调优过程中，选择合适的调优器（如 XGBTuner、GATuner 等）至关重要。不同的调优器在性能优化上可能表现不同，用户应根据具体需求和资源情况选择最适合的调优器，以实现最佳的内核执行性能。

在调优完成后，进行端到端性能评估是不可或缺的步骤。通过比较不同调优模式下的推理时间，用户可以直观了解调优效果，从而为后续的优化提供数据支持。这一过程有助于确保最终模型的实际应用性能。

❓

Apache TVM 是一个支持 CPU 和 GPU 的深度学习编译框架。

可以通过使用 Relay 前端 API 定义网络，配置张量调优设置，并使用不同的调优器进行内核调优。

需要将卷积内核的数据布局从 NCHW 更改为 NCHWc，并使用本地模式进行调优以确保测试结果的准确性。

本文以 resnet-18 为例进行调优。

通过评估端到端性能，比较不同调优模式下的推理时间来进行性能评估。

使用了 XGBTuner、GATuner、RandomTuner 和 GridSearchTuner 等调优器。

🏷️