Triton是一种基于Python的并行编程语言和编译器,旨在高效编写自定义DNN计算内核,以实现现代GPU的最大吞吐量。它支持二维和三维张量的矩阵乘积运算,并提供多种参数选项以优化计算精度和性能。
完成下面两步后,将自动完成登录并继续当前操作。