小红花·文摘

Apache TVM是一个支持多种硬件的深度学习编译框架。本文介绍如何在Zephyr平台上为微型设备编译和执行微模型，包括安装依赖、使用TVMC命令和生成Zephyr项目。通过具体命令，用户可以创建、构建和烧录项目，最终在设备上运行模型。

HyperAI超神经 ·

本文介绍了昇腾CANN模型下沉技术，通过图模式的Host调度和模型下沉调度，优化模型执行性能。模型下沉调度分为模型加载和模型执行两个阶段，降低调度耗时。模型下沉执行方式减少了CPU负载、通信抖动，并提升了E2E收益。模型下沉头开销包括Tensor转换、地址刷新、异步拷贝和模型执行任务。

华为云官方博客 ·