小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
【TVM教程】理解 Relax 抽象层

Apache TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个深度学习编译框架,支持多种硬件。Relax 是其图抽象方式,用于优化机器学习模型。文章介绍了如何使用 Relax 表达神经网络模型的结构与数据流,并提供了高层与底层实现的代码示例,强调数据流块和无副作用函数的重要性,以便于编译器优化。

【TVM教程】理解 Relax 抽象层

HyperAI超神经
HyperAI超神经 · 2026-04-07T02:46:11Z

Apache TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个深度学习编译框架,支持 CPU 和 GPU 等加速芯片。其图抽象用于表示模型结构并优化性能,Relax 是其图表示方法,具备符号形状、多层次抽象和可组合变换等特性,增强了模型优化能力。

【TVM教程】面向机器学习模型的图抽象

HyperAI超神经
HyperAI超神经 · 2026-04-01T04:48:43Z

本文介绍了基于Gradio框架的AI助手实现方案,利用ChatInterface组件快速构建聊天界面,核心功能由chat_stream函数实现,采用Qwen-plus模型,展示了Gradio在AI应用开发中的优势。

【TVM教程】Relax

HyperAI超神经
HyperAI超神经 · 2026-03-24T06:32:18Z

Apache TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个深度学习编译框架,支持多种硬件加速。文章探讨了张量函数转换过程中的性能评估和循环分块等优化技术,展示了如何通过调度和转换提升计算效率。

【TVM教程】转换

HyperAI超神经
HyperAI超神经 · 2026-03-18T08:57:33Z

TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个支持多种硬件的深度学习编译框架。使用 TVMScript 创建 TensorIR 函数可以简化代码,支持动态形状和与 Python 的交互。Tensor Expression 提供了更简洁的计算描述方式。

【TVM教程】TensorIR 创建

HyperAI超神经
HyperAI超神经 · 2026-03-09T01:53:45Z

Apache TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个支持多种硬件的深度学习编译框架。TensorIR 是其张量程序抽象,描述循环及硬件加速选项。示例展示了两个 128×128 矩阵的计算过程,强调了块轴的属性和自包含性,以确保计算的正确性。

【TVM教程】理解 TensorIR 抽象

HyperAI超神经
HyperAI超神经 · 2026-03-02T05:27:04Z

Apache TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个支持多种硬件的深度学习编译框架。文章中展示了原始张量函数的实现,特别是逐元素加法,强调了循环嵌套和计算语句的重要性。TensorIR 中的块和迭代注解有助于程序的变换和优化。

【TVM教程】张量程序抽象

HyperAI超神经
HyperAI超神经 · 2026-02-25T07:50:07Z

安装 TVM 需准备依赖项,Linux 用户可通过包管理器安装,Windows 用户建议使用 WSL。设置构建路径可通过环境变量 `TVM_BUILD_PATH`。编译流程包括获取代码、创建构建空间,并使用 CMake 和 Ninja 进行编译。需注意跨平台兼容性,尤其是 Windows 上的 GPU 加速问题。

【TVM教程】TensorIR

HyperAI超神经
HyperAI超神经 · 2026-02-09T03:13:08Z

Apache TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个深度学习编译框架,支持多种设备。文档为开发者提供了与设备 API 交互的指导,包括 DeviceAPI、Target 和代码生成器的实现细节。开发者需注册新的 DeviceAPI 和 Target,以确保代码生成器能够正确将 IRModule 转换为可执行表示。

【TVM教程】设备/目标交互

HyperAI超神经
HyperAI超神经 · 2026-02-02T03:46:06Z

Apache TVM 更新至 0.21.0 版本,中文文档已同步。新版本引入优化传递管理系统,提升模型性能,支持灵活的优化流水线和调试机制,简化新传递实现,旨在提高可扩展性和用户友好性。

【TVM教程】Pass 基础设施

HyperAI超神经
HyperAI超神经 · 2026-01-27T03:15:52Z

Apache TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个深度学习编译框架,支持 CPU 和 GPU。文章介绍了 TVM 模块序列化的格式与实现,包括 DSO 模块的收集与保存、导入树的创建,以及序列化和反序列化的过程。通过统一的模块序列化机制,TVM 能够生成动态共享库,支持多种模块的导入与恢复。

【TVM教程】模块序列化指南

HyperAI超神经
HyperAI超神经 · 2026-01-20T03:48:09Z

TVM 更新至 0.21.0 版本,中文文档已同步。Apache TVM 是深度学习编译框架,支持 CPU、GPU 和机器学习加速芯片。新版本支持 Vulkan 计算着色器,生成 SPIR-V 着色器并通过 TVM 接口调用,增强了开发体验。

【TVM教程】Vulkan 运行时

HyperAI超神经
HyperAI超神经 · 2026-01-14T02:35:25Z
【TVM教程】TVM 运行时系统

TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个支持多种语言的深度学习编译框架。PackedFunc 解决了跨语言调用的问题,简化了函数调用和模块管理。通过 RPC,可以将函数部署到远程设备,提高开发效率。

【TVM教程】TVM 运行时系统

HyperAI超神经
HyperAI超神经 · 2026-01-05T13:34:22Z
【TVM教程】设计与架构

TVM 更新至 0.21.0 版本,中文文档已同步。Apache TVM 是一个支持多种硬件的深度学习编译框架,文档涵盖编译流程、关键组件和数据结构,并提供优化与转换方法,帮助开发者理解和使用 TVM。

【TVM教程】设计与架构

HyperAI超神经
HyperAI超神经 · 2025-12-29T10:35:19Z

TVM 更新至 0.21.0 版本,中文文档已同步。Apache TVM 是一个支持多种硬件的深度学习编译框架。遇到错误时,建议查阅论坛以寻找解决方案或发帖求助,并提供详细信息以便开发者帮助。

【TVM 教程】处理 TVM 错误

HyperAI超神经
HyperAI超神经 · 2025-12-26T10:38:42Z
【TVM 教程】设置 RPC 系统

TVM 更新至 0.21.0 版本,中文文档已同步。Apache TVM 是深度学习编译框架,支持多种硬件。RPC 功能可在真实硬件上运行已编译的神经网络模型,提升开发效率。RPC 系统包括 RPC Tracker、Proxy 和 Server,便于资源管理和调度。启动 RPC 服务器需遵循特定命令,并确保环境变量配置正确。

【TVM 教程】设置 RPC 系统

HyperAI超神经
HyperAI超神经 · 2025-12-17T09:14:45Z

Apache TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个深度学习编译框架,支持多种硬件。新增参数化单元测试功能,便于在不同目标设备上运行测试,支持 GPU 测试和运行时要求。测试可在本地或 Docker 容器中执行,CI 流程通过 Jenkinsfile 定义。

【TVM 教程】Python 目标参数化

HyperAI超神经
HyperAI超神经 · 2025-12-17T09:01:33Z

Apache TVM 更新至 0.21.0 版本,中文文档已同步。本文介绍如何通过交叉编译与 RPC 在远程设备(如 Raspberry Pi 和 Firefly-RK3399)上执行深度学习模型。步骤包括在远程设备上构建 TVM 运行时、启动 RPC 服务器、在本地编译内核并上传至远程设备,最后展示如何在远程设备上运行 CPU 和 OpenCL 内核,以确保性能评估时避免网络延迟。

【TVM 教程】交叉编译与 RPC

HyperAI超神经
HyperAI超神经 · 2025-12-17T08:37:37Z
活动预告丨上海创智/TileAI/华为/先进编译实验室齐聚上海,TVM/TileRT/PyPTO/Triton各显神通

随着AI模型规模的扩大,AI编译器成为硬件与应用之间的关键枢纽,提升计算性能和资源利用率。12月27日,第8期Meet AI Compiler技术沙龙将在上海举行,专家将分享软件栈设计、算子开发及性能优化等内容,探讨低延迟大模型推理和融合算子开发等技术。欢迎报名参与。

活动预告丨上海创智/TileAI/华为/先进编译实验室齐聚上海,TVM/TileRT/PyPTO/Triton各显神通

HyperAI超神经
HyperAI超神经 · 2025-12-03T06:55:01Z
【TVM 教程】优化大语言模型

Apache TVM 更新至 0.21.0 版本,中文文档已同步。TVM 是一个深度学习编译框架,支持 CPU 和 GPU 等设备。教程展示了如何优化大语言模型(LLM),使用 Hugging Face 的 TinyLlama 模型进行云端或边缘设备的部署,主要步骤包括构建模型、执行优化、生成可部署模块,并在不同设备上运行。

【TVM 教程】优化大语言模型

HyperAI超神经
HyperAI超神经 · 2025-11-21T11:13:13Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码