KernelCAT是一种国产AI算力方案,旨在解决算子开发难题。通过运筹优化技术,它提高了算子调优效率,增强了国产芯片性能,缩短了开发周期,促进了AI模型在本土平台的应用。
在AI编译器技术背景下,Meet AI Compiler第八期活动于12月27日举行,邀请多位专家分享软件栈设计、算子开发和性能优化等主题,促进与会者互动与讨论,形成围绕AI编译器的长期对话。
2025年12月27日,Meet AI Compiler第八期技术沙龙在上海创智学院成功举办。活动邀请五位专家分享AI编译器技术,涵盖软件栈设计、算子开发和性能优化,促进了与会者的深入讨论与交流。
随着AI模型规模的扩大,AI编译器成为硬件与应用之间的关键枢纽,提升计算性能和资源利用率。12月27日,第8期Meet AI Compiler技术沙龙将在上海举行,专家将分享软件栈设计、算子开发及性能优化等内容,探讨低延迟大模型推理和融合算子开发等技术。欢迎报名参与。
摩尔线程开源了高性能线性代数模板库MUTLASS,旨在提升国产GPU的算子开发与算法创新。该库基于CUTLASS优化,支持多种数据精度,提供灵活的C++模板组件,帮助开发者高效释放GPU性能。
飞桨团队与昇腾AI团队联合推出《飞桨x昇腾AI开发者进阶之路》课程,介绍飞桨与昇腾硬件的适配、使用、性能优化和算子开发。课程由三位专家讲解,帮助开发者掌握技巧。直播预告在9月13日晚间19:00进行。
本文介绍了Ascend C算子开发入门的第一次课程,包括Ascend C的优势、多层级API接口以及重要的知识点。Ascend C是CANN针对算子开发场景推出的编程语言,提高算子开发效率。Ascend C提供了0-3级API接口,开发者可以根据需要选择合适的API进行算子逻辑搭建和性能调优。介绍了重复迭代次数、相邻迭代间相同block的地址步长、同一迭代内不同block的地址步长和Mask参数的设置方法。华为全联接大会将于2023年举办,邀请业界同仁探讨智能化的关键举措。
华为在2023年5月6日的昇腾AI开发者峰会上发布了面向算子开发场景的昇腾Ascend C编程语言,提高了算子的开发效率。昇腾AI处理器有多个AI Core,使用Ascend C编程语言开发的算子运行在AI Core上,实现高效的并行计算。Ascend C编程范式包括流水线式编程和矢量编程,通过队列和内存管理模块实现任务间通信和同步。核函数是Ascend C算子的入口,通过封装和调用核函数实现算子的计算。
本文介绍了Ascend C编程语言和算子开发流程,包括多核并行、流水并行和孪生调试的概念和实现方法。同时,还介绍了开发流程和环境准备的步骤,并提供了核函数开发和核函数运行验证的示例代码。
华为云推出了面向算子开发场景的Ascend C编程语言,支持C和C++标准规范,提供了1400+高性能算子库,降低算子开发门槛。Ascend C提供了孪生调试能力,降低调试难度,提升调试效率。
完成下面两步后,将自动完成登录并继续当前操作。