基于流形对齐的层合并压缩 LLM

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

介绍了一种名为Layer Collapse (LaCo)的逐层修剪方法,可快速减小模型大小并保留结构。实验证明,在修剪比例为25-30%时,该方法保持了超过80%的平均任务性能,优于其他结构修剪方法。通过后训练实验证实该修剪方法有效继承了原始模型的参数,并从逐层相似性的角度讨论了提出该方法的动机,评估了修剪的大型语言模型在不同修剪比例下的性能。

🎯

关键要点

  • 提出了一种名为Layer Collapse (LaCo)的逐层修剪方法。
  • 该方法通过将后置模型层折叠到先前层,实现了模型大小的快速减小。
  • 在修剪比例为25-30%时,该方法保持了超过80%的平均任务性能。
  • 该方法显著优于现有最先进的结构修剪方法。
  • 后训练实验验证了该修剪方法有效继承了原始模型的参数。
  • 从逐层相似性的角度讨论了提出该方法的动机。
  • 评估了修剪的大型语言模型在不同修剪比例下的性能。
➡️

继续阅读