【Triton 教程】triton_language.join

💡 原文中文,约700字,阅读约需2分钟。
📝

内容提要

Triton 是一种基于 Python 的并行编程语言和编译器,专为高效编写 DNN 计算内核而设计,能够在现代 GPU 上运行,支持张量连接和广播,张量大小需为 2 的幂。

🎯

关键要点

  • Triton 是一种基于 Python 的并行编程语言和编译器。

  • Triton 旨在高效编写自定义 DNN 计算内核。

  • Triton 能够在现代 GPU 硬件上以最大吞吐量运行。

  • Triton 支持张量连接和广播。

  • 张量大小需为 2 的幂。

  • triton.language.join 函数用于在新的次要维度中连接张量。

  • 连接超过两个元素时,可以多次调用 join 函数。

  • join 是 split 的逆操作。

🏷️

标签

➡️

继续阅读