KS-Lottery: 查找多语言模型的认证彩票

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

通过KS-Lottery方法,使用Kolmogorov-Smirnov检验分析参数分布变化,识别出在多语言微调中非常有效的少数LLM参数集。实验证明,微调LLaMA中的18个标记的嵌入层就足以达到微调翻译性能。

🎯

关键要点

  • 通过使用Kolmogorov-Smirnov检验分析微调前后的参数分布变化,提出了KS-Lottery方法。
  • KS-Lottery方法能够识别在多语言微调中非常有效的少数LLM参数集。
  • 理论上证明KS-Lottery可以在嵌入层中找到有效的参数,保证与全面微调相同的性能表现。
  • 实验结果显示,KS-Lottery在翻译任务上能够获得与全面微调相当的性能,同时使用的参数数量较少。
  • 微调LLaMA中的18个标记的嵌入层足以达到微调翻译性能。
  • 代码和模型将向公众发布。
➡️

继续阅读