【Triton 教程】triton_language.join
💡
原文中文,约700字,阅读约需2分钟。
📝
内容提要
Triton 是一种基于 Python 的并行编程语言和编译器,专为高效编写 DNN 计算内核而设计,能够在现代 GPU 上运行,支持张量连接和广播,张量大小需为 2 的幂。
🎯
关键要点
- Triton 是一种基于 Python 的并行编程语言和编译器。
- Triton 旨在高效编写自定义 DNN 计算内核。
- Triton 能够在现代 GPU 硬件上以最大吞吐量运行。
- Triton 支持张量连接和广播。
- 张量大小需为 2 的幂。
- triton.language.join 函数用于在新的次要维度中连接张量。
- 连接超过两个元素时,可以多次调用 join 函数。
- join 是 split 的逆操作。
➡️