低秩适应的Nyström初始化方法用于大规模语言模型
📝
内容提要
本研究针对大规模语言模型(LLMs)微调过程中的低秩适应(LoRA)方法的收敛速度慢和计算开销大的问题,提出了一种新的Nyström方法,通过引入StructuredLoRA和NyströmLoRA优化初始化,从而提高效率和效果。此外,IntermediateTune方法专注于中间矩阵的微调,以进一步提升LLM的效率。研究结果表明,NLoRA在多个自然语言生成和理解任务上显著超越传统LoRA...
🏷️
标签
➡️