飞桨提供Triton算子接入方案,降低适配成本
📝
内容提要
开发者依旧使用Triton的DSL(如 tl.load、tl.store、tl.arange、tl.program_id、tl.constexpr 等)以及原生的@triton.jit与@triton.autotune装饰器来编写高性能GPU...
🏷️
标签
➡️