LLaMA 简化: 大型语言模型的简单深度修剪

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

Compresso通过合作的剪枝算法和大型语言模型自身,成功将LLaMA-7B剪枝至5.4B,并在多个基准测试上获得更高分数。

🎯

关键要点

  • Compresso通过合作的剪枝算法和大型语言模型自身,成功将LLaMA-7B剪枝至5.4B。

  • 在数据收集和训练成本昂贵的挑战下,Compresso学习最优的剪枝决策。

  • 引入协同提示进一步增强了剪枝算法。

  • 在阅读理解上超过LLaMA-7B2.62%。

  • 在共同推理、阅读理解、MMLU和BBH基准测试上分别获得了2.21%、11.43%、7.04%和4.81%的更高分数。

  • Compresso的表现明显优于一次性剪枝基线。

➡️

继续阅读