【Triton 教程】triton_language.zeros

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

Triton是一种基于Python的并行编程语言和编译器,旨在高效编写自定义深度神经网络计算内核,以实现现代GPU的最大吞吐量。

🎯

关键要点

  • Triton是一种用于并行编程的语言和编译器。
  • Triton基于Python,旨在高效编写自定义深度神经网络计算内核。
  • Triton能够在现代GPU硬件上以最大吞吐量运行。
  • 提供了triton.language.zeros函数,用于返回填充了标量值0的张量。
➡️

继续阅读