MoRA: 参数高效微调的高阶更新
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种名为MoRA的新方法,通过引入非参数操作来降低输入维度并增加输出维度,实现了高秩更新,同时保持了可训练参数的数量。在五个任务中对该方法进行了评估,结果显示在占用内存的任务上表现优于LoRA,并在其他任务上达到了可比较的性能。
🎯
关键要点
- 提出了一种名为MoRA的新方法。
- MoRA通过引入非参数操作降低输入维度并增加输出维度。
- 实现了高秩更新,同时保持可训练参数的数量。
- 在五个任务中对MoRA进行了全面评估。
- MoRA在占用内存的任务上表现优于LoRA。
- 在其他任务上,MoRA达到了可比较的性能。
➡️