KS-Lottery: 查找多语言模型的认证彩票
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
通过KS-Lottery方法,使用Kolmogorov-Smirnov检验分析参数分布变化,识别出在多语言微调中非常有效的少数LLM参数集。实验证明,微调LLaMA中的18个标记的嵌入层就足以达到微调翻译性能。
🎯
关键要点
- 通过使用Kolmogorov-Smirnov检验分析微调前后的参数分布变化,提出了KS-Lottery方法。
- KS-Lottery方法能够识别在多语言微调中非常有效的少数LLM参数集。
- 理论上证明KS-Lottery可以在嵌入层中找到有效的参数,保证与全面微调相同的性能表现。
- 实验结果显示,KS-Lottery在翻译任务上能够获得与全面微调相当的性能,同时使用的参数数量较少。
- 微调LLaMA中的18个标记的嵌入层足以达到微调翻译性能。
- 代码和模型将向公众发布。
➡️