动态 ASR 路径:多语音 ASR 模型高效剪枝的自适应遮罩方法
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
该研究评估了基于结构化剪枝在多语言预训练语言模型上的设置、算法和效率,并提出了一种动态稀疏化的方法。实验结果填补了关于多语言预训练模型上的结构化剪枝研究的空白,为未来的研究提供启示。
🎯
关键要点
- 本研究评估了基于结构化剪枝在多语言预训练语言模型上的设置、算法和效率。
- 实验展示了一些反直觉现象,涉及九个下游任务。
- 提出了一种动态稀疏化的方法,允许模型在不同稀疏度水平上进行比较。
- 动态稀疏化方法使模型只需训练一次即可适应不同的模型大小。
- 研究填补了多语言预训练模型上的结构化剪枝研究空白,为未来研究提供启示。
🏷️
标签
➡️