小红花·文摘

本文讨论了PyTorch AOTInductor如何将具有混合设备执行计划的PyTorch导出程序编译成单个可执行包，该包可在CPU和GPU上运行模型，无需手动拆分模型。示例展示了如何使用AOTInductor编译和加载模型，并通过性能分析验证混合执行的有效性。

PyTorch AOTInductor 混合降级

Lei Mao's Log Book ·

Apache TVM是一个深度学习编译框架，支持在Arm Cortex-M55 CPU和Ethos-U55 NPU上运行模型。本文介绍如何在固定虚拟平台上编译和运行MobileNet v1模型，并使用CMSIS-NN进行优化。通过命令行工具tvmc进行模型编译，并提供必要的Python依赖和示例代码，最终实现对输入图像的分类。

【TVM教程】在支持 CMSIS-NN 的 Arm(R) Cortex(R)-M55 CPU 和 Ethos(TM)-U55 NPU 裸机上运行 TVM

HyperAI超神经 ·

ONNX-MLIR 和 TVM 是两种机器学习模型编译和优化工具。ONNX-MLIR 专注于 ONNX 格式，适用于固定架构；而 TVM 支持多种格式，强调自动优化，适合多样化的深度学习应用。两者均支持跨平台运行和模型优化。

ONNX-MLIR 與 TVM：機器學習編譯器的比較與分析

1010Code ·

ONNX-MLIR和TVM是两种机器学习模型编译和优化工具。ONNX-MLIR专注于ONNX格式模型的优化，适合固定架构场景；TVM支持多种模型格式，强调自动优化，适合多样化深度学习应用。两者在设计目标和应用场景上存在显著差异。

ONNX-MLIR 與 TVM：機器學習編譯器的比較與分析

1010Code ·