【Triton 教程】triton_language.join
原文中文,约700字,阅读约需2分钟。
📝
内容提要
Triton 是一种基于 Python 的并行编程语言和编译器,专为高效编写 DNN 计算内核而设计,能够在现代 GPU 上运行,支持张量连接和广播,张量大小需为 2 的幂。
🎯
关键要点
-
Triton 是一种基于 Python 的并行编程语言和编译器。
-
Triton 旨在高效编写自定义 DNN 计算内核。
-
Triton 能够在现代 GPU 硬件上以最大吞吐量运行。
-
Triton 支持张量连接和广播。
-
张量大小需为 2 的幂。
-
triton.language.join 函数用于在新的次要维度中连接张量。
-
连接超过两个元素时,可以多次调用 join 函数。
-
join 是 split 的逆操作。
🏷️