基于昇腾计算语言AscendCL开发AI推理应用

💡 原文中文,约6900字,阅读约需17分钟。
📝

内容提要

AscendCL提供了统一的API框架,支持同步模型执行和异步模型执行,支持动态Batch、动态分辨率等特性,模型推理时需要准备模型的输入、输出数据结构,并存放好模型执行的输入数据,推理结束后需要卸载模型,释放模型描述信息、工作内存和权值内存。更多知识可以在昇腾社区在线课程、昇腾论坛和昇腾CANN样例仓获取。

🎯

关键要点

  • AscendCL是昇腾计算开放编程框架,提供统一的API框架。
  • AscendCL支持同步和异步模型执行,动态Batch和动态分辨率等特性。
  • 使用AscendCL时,需通过接口操作数据类型,减少兼容性问题。
  • 开发应用前需初始化AscendCL,完成后需去初始化。
  • 运行管理资源包括Device、Context、Stream,需按顺序申请和释放。
  • AscendCL提供媒体数据处理接口,满足模型对输入图片的要求。
  • 模型推理需使用适配的离线模型,支持多种加载方式。
  • 模型执行时需准备输入输出数据结构,使用特定数据类型存放。
  • AscendCL支持同步和异步模型执行,用户可选择合适的方式。
  • 推理结束后需卸载模型,释放相关内存,防止内存泄露。
  • 更多知识可在昇腾社区在线课程、论坛和样例仓获取。
🏷️

标签

➡️

继续阅读