动态 ASR 路径:多语音 ASR 模型高效剪枝的自适应遮罩方法

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

该研究评估了基于结构化剪枝在多语言预训练语言模型上的设置、算法和效率,并提出了一种动态稀疏化的方法。实验结果填补了关于多语言预训练模型上的结构化剪枝研究的空白,为未来的研究提供启示。

🎯

关键要点

  • 本研究评估了基于结构化剪枝在多语言预训练语言模型上的设置、算法和效率。
  • 实验展示了一些反直觉现象,涉及九个下游任务。
  • 提出了一种动态稀疏化的方法,允许模型在不同稀疏度水平上进行比较。
  • 动态稀疏化方法使模型只需训练一次即可适应不同的模型大小。
  • 研究填补了多语言预训练模型上的结构化剪枝研究空白,为未来研究提供启示。
➡️

继续阅读