基于昇腾计算语言AscendCL开发AI推理应用
💡
原文中文,约6900字,阅读约需17分钟。
📝
内容提要
AscendCL提供了统一的API框架,支持同步模型执行和异步模型执行,支持动态Batch、动态分辨率等特性,模型推理时需要准备模型的输入、输出数据结构,并存放好模型执行的输入数据,推理结束后需要卸载模型,释放模型描述信息、工作内存和权值内存。更多知识可以在昇腾社区在线课程、昇腾论坛和昇腾CANN样例仓获取。
🎯
关键要点
- AscendCL是昇腾计算开放编程框架,提供统一的API框架。
- AscendCL支持同步和异步模型执行,动态Batch和动态分辨率等特性。
- 使用AscendCL时,需通过接口操作数据类型,减少兼容性问题。
- 开发应用前需初始化AscendCL,完成后需去初始化。
- 运行管理资源包括Device、Context、Stream,需按顺序申请和释放。
- AscendCL提供媒体数据处理接口,满足模型对输入图片的要求。
- 模型推理需使用适配的离线模型,支持多种加载方式。
- 模型执行时需准备输入输出数据结构,使用特定数据类型存放。
- AscendCL支持同步和异步模型执行,用户可选择合适的方式。
- 推理结束后需卸载模型,释放相关内存,防止内存泄露。
- 更多知识可在昇腾社区在线课程、论坛和样例仓获取。
🏷️
标签
➡️