随着AI模型规模的增长,算子性能优化变得至关重要。飞桨推出了Triton算子接入方案,简化了开发者使用Triton编写GPU内核的过程,实现了“零改动复用”。开发者可以无缝调用Triton算子,从而提升性能与兼容性,推动开放的算子生态,降低协作成本。
完成下面两步后,将自动完成登录并继续当前操作。