小红花·文摘

Triton是一种基于Python的并行编程语言和编译器，旨在高效编写自定义深度神经网络计算内核，并在现代GPU上运行。它提供了多种处理张量的函数，如argmax、argmin、max、min、reduce和sum。

【Triton 教程】triton-ops

HyperAI超神经 ·

文章分享了AI编程经验，强调使用Plan模式进行并行编程以避免代码冲突，并指出在项目后期需重视架构与逻辑，利用详细日志进行调试。Grok提供最新最佳实践，提升AI编程效果。

AI 编程经验分享

Andy Stewart ·

Triton 是一种基于 Python 的并行编程语言和编译器，旨在高效编写自定义深度神经网络计算内核，以实现现代 GPU 的最大吞吐量。

【Triton 教程】triton_language.swizzle2d

HyperAI超神经 ·

Triton是一种基于Python的并行编程语言和编译器，旨在高效编写自定义DNN计算内核，并在现代GPU上运行。它支持多种指针类型和边界检查选项，能够存储数据张量。

【Triton 教程】triton_language.store

HyperAI超神经 ·

Triton是一种基于Python的并行编程语言和编译器，旨在高效编写自定义DNN计算内核，并在现代GPU上实现最大吞吐量。它支持加载数据张量以及多种指针类型和参数选项。

【Triton 教程】triton_language.load

HyperAI超神经 ·

Triton是一种基于Python的并行编程语言和编译器，旨在高效编写自定义DNN计算内核，以实现现代GPU的最大吞吐量。它支持二维和三维张量的矩阵乘积运算，并提供多种参数选项以优化计算精度和性能。

【Triton 教程】triton_language.dot

HyperAI超神经 ·

Triton 是一种基于 Python 的并行编程语言和编译器，专为高效编写 DNN 计算内核而设计，能够在现代 GPU 上运行，支持张量连接和广播，张量大小需为 2 的幂。

【Triton 教程】triton_language.join

HyperAI超神经 ·

Triton 是一种基于 Python 的并行编程语言和编译器，旨在高效编写自定义深度神经网络计算内核，并在现代 GPU 上实现最佳性能。

【Triton 教程】triton_language.interleave

HyperAI超神经 ·

Triton 是一种基于 Python 的并行编程语言和编译器，旨在高效编写深度神经网络计算内核，以实现现代 GPU 的最大吞吐量。

【Triton 教程】triton_language.expand_dims

HyperAI超神经 ·

在.NET 8中，C#开发者可以通过理解CPU架构、利用SIMD技术、优化算法与数据结构以及并行编程来提升CPU性能。同时，原生AOT编译和改进的JIT编译器也能显著提高应用程序的效率。

微软工程师不会告诉你的.NET8秘密：如何用C#榨干CPU性能？

dotNET跨平台 ·

Triton是一种基于Python的并行编程语言和编译器，旨在高效编写自定义深度神经网络计算内核，以实现现代GPU的最大吞吐量。

【Triton 教程】triton_language.broadcast

HyperAI超神经 ·

Triton是一种基于Python的并行编程语言和编译器，旨在高效编写自定义深度神经网络计算内核，以实现现代GPU的最大吞吐量。

【Triton 教程】triton_language.zeros_like

HyperAI超神经 ·

Triton 是一种基于 Python 的并行编程语言和编译器，旨在高效编写自定义 DNN 计算内核，以实现现代 GPU 的最大吞吐量。

【Triton 教程】triton_language.zeros_like

HyperAI超神经 ·

Triton是一种基于Python的并行编程语言和编译器，旨在高效编写自定义深度神经网络计算内核，以实现现代GPU的最大吞吐量。

【Triton 教程】triton_language.zeros

HyperAI超神经 ·

在多核处理器时代，后端工程师需掌握并行编程。Guy L. Steele Jr. 提出应关注独立性而非并行本身，强调“分治”和“结合性”原则，鼓励将问题分解为独立子问题以简化并行设计。Go 语言通过 Goroutine 和 Channel 降低并发编程复杂性，但仍需开发者主动设计并行策略。

Go并行编程的“第一性原理”：Guy Steele 教你如何“不去想”并行

Tony Bai ·

Triton 是一种基于 Python 的并行编程语言和编译器，旨在高效编写自定义深度神经网络计算内核，以实现现代 GPU 的最大吞吐量。

【Triton 教程】triton_language.full

HyperAI超神经 ·

Triton是一种基于Python的并行编程语言和编译器，旨在高效编写自定义深度神经网络计算内核，并在现代GPU上实现高吞吐量运行。

【Triton 教程】triton_language.program_id

HyperAI超神经 ·

Triton 是一种基于 Python 的并行编程语言和编译器，旨在高效编写自定义 DNN 计算内核，并在现代 GPU 上运行。其核心数据结构为张量，支持多种操作和函数，简化编程过程。

【Triton 教程】triton_language.tensor

HyperAI超神经 ·

Triton 是一种基于 Python 的并行编程语言和编译器，旨在高效编写 DNN 计算内核，并在现代 GPU 上实现最大吞吐量。它提供了 @triton.heuristics 装饰器，用于指定元参数值的计算方法。

【Triton 教程】triton.heuristics

HyperAI超神经 ·

Triton是一种基于Python的并行编程语言和编译器，旨在高效编写自定义深度神经网络计算内核，以实现现代GPU的最大吞吐量。

【Triton 教程】triton_language.zeros

HyperAI超神经 ·