CULL-MT: A Compression Method for Machine Translation Based on Language and Layer Pruning
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出CULL-MT方法,通过结构层剪枝和选择语言方向,解决多语言机器翻译模型推理开销增加的问题。该方法采用贪婪策略识别不重要层,并通过知识蒸馏和参数微调减轻影响。研究表明,NLLB-3.3B模型在多方向翻译中表现鲁棒,而LLaMA3.1-8B-Instruct对层剪枝更敏感。
🎯
关键要点
- CULL-MT方法通过结构层剪枝和选择语言方向来解决多语言机器翻译模型推理开销增加的问题。
- 该方法采用贪婪策略识别不重要的层,并通过知识蒸馏和参数微调减轻影响。
- 研究表明,NLLB-3.3B模型在多方向翻译中表现鲁棒。
- LLaMA3.1-8B-Instruct对层剪枝更敏感。
➡️