Flora: 低秩适配器是隐形的梯度压缩器
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本研究提出了Flora方法,通过重新采样投影矩阵实现高秩更新,减少优化状态的存储消耗,同时保持次线性空间复杂度。实验证明该方法的有效性。
🎯
关键要点
- 提出了低秩适应(LoRA)方法,通过训练较少的参数来减少优化状态的存储消耗。
- 低秩适应限制整体权重更新矩阵为低秩。
- 观察到低秩适应可以用随机投影来近似。
- 提出了Flora方法,通过重新采样投影矩阵实现高秩更新。
- Flora方法保持优化状态的次线性空间复杂度。
- 实验证明了Flora方法的有效性。
🏷️
标签
➡️