本研究提出CULL-MT方法,通过结构层剪枝和选择语言方向,解决多语言机器翻译模型推理开销增加的问题。该方法采用贪婪策略识别不重要层,并通过知识蒸馏和参数微调减轻影响。研究表明,NLLB-3.3B模型在多方向翻译中表现鲁棒,而LLaMA3.1-8B-Instruct对层剪枝更敏感。
完成下面两步后,将自动完成登录并继续当前操作。