【TVM 教程】在 Adreno™ 上部署预训练模型

💡 原文中文,约8900字,阅读约需22分钟。
📝

内容提要

本文是一个逐步教程,演示如何在 Adreno 上部署预训练的 PyTorch ResNet-18 模型。首先,安装 PyTorch 与 TorchVision。然后,在 Adreno GPU 上部署模型。接下来,准备运行 TVM RPC 服务器,并设置相关环境变量。获取 PyTorch 模型,并处理图片。将 PyTorch 模型转换为 Relay 模块。准备 TVM 目标,并进行自动调优。最后,通过 RPC 部署模型,并进行推理。

🎯

关键要点

  • 本文是一个逐步教程,演示如何在 Adreno 上部署预训练的 PyTorch ResNet-18 模型。
  • 首先,需要安装 PyTorch 与 TorchVision,可以通过 pip 快速安装。
  • 在 Adreno GPU 上部署模型,推送必要的文件到设备上并运行 TVM RPC 服务器。
  • 设置 Android 设备的哈希值,并上传所需的库文件。
  • 启动 rpc_tracker 和 tvm_rpc 服务器,并设置相关环境变量。
  • 检查 tracker 是否正在运行,并确认设备可用。
  • 获取 PyTorch 模型并处理输入图片,使用 torchvision 进行预处理。
  • 将 PyTorch 模型转换为 Relay 模块,支持混合精度计算。
  • 准备 TVM 目标,设置自动调优参数以优化模型性能。
  • 启用 OpenCLML 加速运算符库以提高计算效率。
  • 通过 RPC 将模型部署到远程 Adreno 设备,并进行推理。
  • 设置输入并获取模型的输出预测,展示模型的性能信息。
🏷️

标签

➡️

继续阅读