小红花·文摘

本文讨论了PyTorch AOTInductor如何将具有混合设备执行计划的PyTorch导出程序编译成单个可执行包，该包可在CPU和GPU上运行模型，无需手动拆分模型。示例展示了如何使用AOTInductor编译和加载模型，并通过性能分析验证混合执行的有效性。