The Key Role of Initialization in Matrix Decomposition

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究探讨了低秩矩阵分解中初始化对收敛速度的影响,提出了Nystrom初始化,显著提升了ScaledGD的全局收敛性,并扩展至低秩适配器(LoRA),在多项任务中表现优异。

🎯

关键要点

  • 本研究探讨了低秩矩阵分解中的初始化对收敛速度的影响。
  • 填补了非凸和非平滑优化领域的关键空白。
  • 提出了Nystrom初始化,显著提升了ScaledGD的全局收敛性。
  • Nystrom初始化扩展至低秩适配器(LoRA),用于微调基础模型。
  • 施加Nystrom初始化的NoRA在各种下游任务和模型规模中表现优异。
➡️

继续阅读