FTuner是一种新的深度学习编译器技术,使用uKernel拼接小张量以匹配输入张量的形状,并使用硬件信息模型确定uKernel的形状。实验证明,FTuner在运算符和端到端性能上与供应商库相当,并且在现有的自动调整器上实现了3%的速度提升,同时减少了调整时间。
完成下面两步后,将自动完成登录并继续当前操作。