Ascend C 自定义算子 Kernel Launch调用入门

💡 原文中文,约9400字,阅读约需23分钟。
📝

内容提要

本文介绍了华为云Ascend C自定义算子的Kernel Launch调用方式。通过ACLRT_LAUNCH_KERNEL调用接口,可以异步调用算子核函数,并提供参数列表。华为云官方提供了简易的算子工程,开发者可以基于该工程进行算子开发。文章还提供了算子工程的目录结构和开发步骤。最后,文章展示了一个PRelu算子的示例代码,包括核函数的实现和调用应用程序的主函数。

🎯

关键要点

  • 本文介绍华为云Ascend C自定义算子的Kernel Launch调用方式。
  • 通过ACLRT_LAUNCH_KERNEL接口可以异步调用算子核函数,并提供参数列表。
  • 华为云提供简易的算子工程,开发者可以基于该工程进行算子开发。
  • 文章提供算子工程的目录结构和开发步骤。
  • Kernel Launch开放式编程为试用特性,不支持商用产品。
  • ACLRT_LAUNCH_KERNEL调用方式对内核调用符进行了功能加强,支持异步调用。
  • 算子工程支持调试功能,如PRINTF和DumpTensor。
  • 开发者需完成算子kernel侧实现和编写调用应用程序main.cpp。
  • 提供了PRelu算子的示例代码,包括核函数的实现和调用应用程序的主函数。
  • 执行代码进行NPU和CPU调试的命令示例。
🏷️

标签

➡️

继续阅读