小红花·文摘

本教程演示了如何使用 TVMScript、NNModule API、Block Builder API 以及 PackedFunc API，根据不同的应用场景来创建 Relax 程序（可右键另存为下载）。

【TVM教程】创建 Relax

HyperAI超神经 ·

【TVM教程】理解 Relax 抽象层

HyperAI超神经 ·

Apache TVM 更新至 0.21.0 版本，中文文档已同步。TVM 是一个深度学习编译框架，支持 CPU 和 GPU 等加速芯片。其图抽象用于表示模型结构并优化性能，Relax 是其图表示方法，具备符号形状、多层次抽象和可组合变换等特性，增强了模型优化能力。

【TVM教程】面向机器学习模型的图抽象

HyperAI超神经 ·

本文介绍了基于Gradio框架的AI助手实现方案，利用ChatInterface组件快速构建聊天界面，核心功能由chat_stream函数实现，采用Qwen-plus模型，展示了Gradio在AI应用开发中的优势。

【TVM教程】Relax

HyperAI超神经 ·

Apache TVM 更新至 0.21.0 版本，中文文档已同步。TVM 是一个深度学习编译框架，支持多种硬件加速。文章探讨了张量函数转换过程中的性能评估和循环分块等优化技术，展示了如何通过调度和转换提升计算效率。

【TVM教程】转换

HyperAI超神经 ·

TVM 更新至 0.21.0 版本，中文文档已同步。TVM 是一个支持多种硬件的深度学习编译框架。使用 TVMScript 创建 TensorIR 函数可以简化代码，支持动态形状和与 Python 的交互。Tensor Expression 提供了更简洁的计算描述方式。

【TVM教程】TensorIR 创建

HyperAI超神经 ·

Apache TVM 更新至 0.21.0 版本，中文文档已同步。TVM 是一个支持多种硬件的深度学习编译框架。TensorIR 是其张量程序抽象，描述循环及硬件加速选项。示例展示了两个 128×128 矩阵的计算过程，强调了块轴的属性和自包含性，以确保计算的正确性。

【TVM教程】理解 TensorIR 抽象

HyperAI超神经 ·

Apache TVM 更新至 0.21.0 版本，中文文档已同步。TVM 是一个支持多种硬件的深度学习编译框架。文章中展示了原始张量函数的实现，特别是逐元素加法，强调了循环嵌套和计算语句的重要性。TensorIR 中的块和迭代注解有助于程序的变换和优化。

【TVM教程】张量程序抽象

HyperAI超神经 ·

安装 TVM 需准备依赖项，Linux 用户可通过包管理器安装，Windows 用户建议使用 WSL。设置构建路径可通过环境变量 `TVM_BUILD_PATH`。编译流程包括获取代码、创建构建空间，并使用 CMake 和 Ninja 进行编译。需注意跨平台兼容性，尤其是 Windows 上的 GPU 加速问题。

【TVM教程】TensorIR

HyperAI超神经 ·

Apache TVM 更新至 0.21.0 版本，中文文档已同步。TVM 是一个深度学习编译框架，支持多种设备。文档为开发者提供了与设备 API 交互的指导，包括 DeviceAPI、Target 和代码生成器的实现细节。开发者需注册新的 DeviceAPI 和 Target，以确保代码生成器能够正确将 IRModule 转换为可执行表示。

【TVM教程】设备/目标交互

HyperAI超神经 ·

Apache TVM 更新至 0.21.0 版本，中文文档已同步。新版本引入优化传递管理系统，提升模型性能，支持灵活的优化流水线和调试机制，简化新传递实现，旨在提高可扩展性和用户友好性。

【TVM教程】Pass 基础设施

HyperAI超神经 ·

Apache TVM 更新至 0.21.0 版本，中文文档已同步。TVM 是一个深度学习编译框架，支持 CPU 和 GPU。文章介绍了 TVM 模块序列化的格式与实现，包括 DSO 模块的收集与保存、导入树的创建，以及序列化和反序列化的过程。通过统一的模块序列化机制，TVM 能够生成动态共享库，支持多种模块的导入与恢复。

【TVM教程】模块序列化指南

HyperAI超神经 ·

TVM 更新至 0.21.0 版本，中文文档已同步。Apache TVM 是深度学习编译框架，支持 CPU、GPU 和机器学习加速芯片。新版本支持 Vulkan 计算着色器，生成 SPIR-V 着色器并通过 TVM 接口调用，增强了开发体验。

【TVM教程】Vulkan 运行时

HyperAI超神经 ·

【TVM教程】TVM 运行时系统

HyperAI超神经 ·

【TVM教程】设计与架构

HyperAI超神经 ·

TVM 更新至 0.21.0 版本，中文文档已同步。Apache TVM 是一个支持多种硬件的深度学习编译框架。遇到错误时，建议查阅论坛以寻找解决方案或发帖求助，并提供详细信息以便开发者帮助。

【TVM 教程】处理 TVM 错误

HyperAI超神经 ·

【TVM 教程】设置 RPC 系统

HyperAI超神经 ·

Apache TVM 更新至 0.21.0 版本，中文文档已同步。TVM 是一个深度学习编译框架，支持多种硬件。新增参数化单元测试功能，便于在不同目标设备上运行测试，支持 GPU 测试和运行时要求。测试可在本地或 Docker 容器中执行，CI 流程通过 Jenkinsfile 定义。

【TVM 教程】Python 目标参数化

HyperAI超神经 ·

Apache TVM 更新至 0.21.0 版本，中文文档已同步。本文介绍如何通过交叉编译与 RPC 在远程设备（如 Raspberry Pi 和 Firefly-RK3399）上执行深度学习模型。步骤包括在远程设备上构建 TVM 运行时、启动 RPC 服务器、在本地编译内核并上传至远程设备，最后展示如何在远程设备上运行 CPU 和 OpenCL 内核，以确保性能评估时避免网络延迟。

【TVM 教程】交叉编译与 RPC

HyperAI超神经 ·

活动预告丨上海创智/TileAI/华为/先进编译实验室齐聚上海，TVM/TileRT/PyPTO/Triton各显神通

HyperAI超神经 ·