神经语言模型修剪用于自动语音识别
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该研究提出了基于Transformer的语音识别神经网络语言模型的模型修剪方法,包括准则、方法和调度器,并提出了适用于渐进式压缩模型的低秩逼近的变体。研究结果表明,数据驱动的修剪效果优于基于幅度的修剪,渐进式修剪比一次性修剪表现更好,低秩逼近提供了尺寸减小和推理加速之间的最佳平衡。
🎯
关键要点
-
该研究提出了基于Transformer的语音识别神经网络语言模型的模型修剪方法。
-
研究探讨了修剪框架的三个方面:准则、方法和调度器。
-
数据驱动的修剪效果优于基于幅度的修剪。
-
渐进式修剪在准确性方面优于一次性修剪,尤其是在目标尺寸较小时。
-
低秩逼近在中等压缩程度下提供了尺寸减小和推理加速之间的最佳平衡。
➡️