💡
原文中文,约1000字,阅读约需3分钟。
📝
内容提要
摩尔线程开源了高性能线性代数模板库MUTLASS,旨在提升国产GPU的算子开发与算法创新。该库基于CUTLASS优化,支持多种数据精度,提供灵活的C++模板组件,帮助开发者高效释放GPU性能。
🎯
关键要点
-
摩尔线程开源高性能线性代数模板库MUTLASS,旨在提升国产GPU的算子开发与算法创新。
-
MUTLASS支持多种数据精度,帮助开发者高效释放GPU性能。
-
该库基于CUTLASS优化,提供灵活的C++模板组件。
-
MUTLASS专为MUSA架构优化,适配了CuTe后端库,支持TF32/FP16/BF16/INT8等数据精度。
-
开发者可以灵活复用和修改模板组件,以较低成本实现高性能算子。
-
摩尔线程将持续优化MUTLASS,并欢迎开发者提供反馈,推动生态建设。
➡️