【Triton 教程】triton_language.broadcast
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
Triton是一种基于Python的并行编程语言和编译器,旨在高效编写自定义深度神经网络计算内核,以实现现代GPU的最大吞吐量。
🎯
关键要点
-
Triton是一种用于并行编程的语言和编译器。
-
Triton提供基于Python的编程环境。
-
Triton旨在高效编写自定义深度神经网络计算内核。
-
Triton能够在现代GPU硬件上以最大吞吐量运行。
-
Triton的中文文档可在指定链接访问。
-
triton.language.broadcast函数用于将两个块广播到共同兼容的形状。
➡️