FTuner: 一个快速的深度学习编译器的动态形状张量程序自动调整器

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

FTuner是一种新的深度学习编译器技术,使用uKernel拼接小张量以匹配输入张量的形状,并使用硬件信息模型确定uKernel的形状。实验证明,FTuner在运算符和端到端性能上与供应商库相当,并且在现有的自动调整器上实现了3%的速度提升,同时减少了调整时间。

🎯

关键要点

  • FTuner是一种新的深度学习编译器技术。

  • FTuner使用uKernel拼接小张量以匹配输入张量的形状。

  • FTuner利用硬件信息模型确定uKernel的形状。

  • 实验证明FTuner在运算符和端到端性能上与供应商库相当。

  • FTuner在现有的自动调整器上实现了3%的速度提升。

  • FTuner减少了两个数量级的调整时间。

➡️

继续阅读