本研究提出了一种基于共识的层剪枝方法,结合多个相似性指标,克服了单一标准的局限性,实现了78.80%的FLOPs减少,同时降低了能耗和碳排放,分别为66.99%和68.75%。
本研究提出CULL-MT方法,通过结构层剪枝和选择语言方向,解决多语言机器翻译模型推理开销增加的问题。该方法采用贪婪策略识别不重要层,并通过知识蒸馏和参数微调减轻影响。研究表明,NLLB-3.3B模型在多方向翻译中表现鲁棒,而LLaMA3.1-8B-Instruct对层剪枝更敏感。
完成下面两步后,将自动完成登录并继续当前操作。