Ascend C 自定义算子 Kernel Launch调用入门
💡
原文中文,约9400字,阅读约需23分钟。
📝
内容提要
本文介绍了华为云Ascend C自定义算子的Kernel Launch调用方式。通过ACLRT_LAUNCH_KERNEL调用接口,可以异步调用算子核函数,并提供参数列表。华为云官方提供了简易的算子工程,开发者可以基于该工程进行算子开发。文章还提供了算子工程的目录结构和开发步骤。最后,文章展示了一个PRelu算子的示例代码,包括核函数的实现和调用应用程序的主函数。
🎯
关键要点
- 本文介绍华为云Ascend C自定义算子的Kernel Launch调用方式。
- 通过ACLRT_LAUNCH_KERNEL接口可以异步调用算子核函数,并提供参数列表。
- 华为云提供简易的算子工程,开发者可以基于该工程进行算子开发。
- 文章提供算子工程的目录结构和开发步骤。
- Kernel Launch开放式编程为试用特性,不支持商用产品。
- ACLRT_LAUNCH_KERNEL调用方式对内核调用符进行了功能加强,支持异步调用。
- 算子工程支持调试功能,如PRINTF和DumpTensor。
- 开发者需完成算子kernel侧实现和编写调用应用程序main.cpp。
- 提供了PRelu算子的示例代码,包括核函数的实现和调用应用程序的主函数。
- 执行代码进行NPU和CPU调试的命令示例。
➡️