【Triton 教程】triton_language.expand_dims

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

Triton 是一种基于 Python 的并行编程语言和编译器,旨在高效编写深度神经网络计算内核,以实现现代 GPU 的最大吞吐量。

🎯

关键要点

  • Triton 是一种用于并行编程的语言和编译器。
  • Triton 提供基于 Python 的编程环境,旨在高效编写自定义 DNN 计算内核。
  • Triton 能够在现代 GPU 硬件上以最大吞吐量运行。
  • Triton 提供了扩展张量形状的功能,通过插入新的长度为 1 的维度。
  • 扩展张量的轴索引是相对于生成的张量而言的。
➡️

继续阅读