机器之心 ·

LoRA、完全微调到底有何不同？MIT 21页论文讲明白了

💡 原文中文，约2900字，阅读约需7分钟。

📝

内容提要

本文比较了完全微调与低秩自适应（LoRA）在大型语言模型微调中的差异。研究表明，LoRA模型存在“侵入维度”，导致其在持续学习中表现不佳，遗忘更多预训练信息。尽管LoRA在特定任务上表现良好，但完全微调在泛化能力和适应性方面更强。

🎯

❓

LoRA模型存在侵入维度，导致其在持续学习中表现不佳，而完全微调在泛化能力和适应性方面更强。

侵入维度是LoRA训练中出现的高秩奇异向量，导致模型在适应新任务时遗忘更多预训练信息。

尽管LoRA在特定任务上表现良好，但其泛化能力和适应性不如完全微调。

完全微调的模型没有侵入维度，能够更好地保持预训练信息，从而在持续学习中表现更佳。

LoRA的秩越高，遗忘行为越少，接近完全微调的效果，尤其在秩达到2048时，侵入维度消失。

使用LoRA微调通用LLM可能导致模型失去一些泛化能力，因为它增加了侵入维度。

🏷️

2026 06 05 HackerNews
特德·姜批评将人工智能拟人化，指出大型语言模型（LLM）并不具备意识或情感。加州大学伯克利分校因学生过度依赖AI，计算机科学课程的不及格率显著上升。美国政...
自主代理面临的最大挑战：数据库。
大型语言模型正在从简单的聊天机器人发展为能够推理和行动的自主代理，但数据库优化的复杂性仍是主要挑战。卡内基梅隆大学的安迪·帕夫洛指出，AI在数据库领域的影...
我用彩色配件定制了一台MacBook Neo
苹果的MacBook Neo是最便宜、色彩丰富且易于维修的笔记本电脑。用户可以自行更换彩色配件，尽管成本较高。作者尝试定制Neo，替换触控板、底壳和键帽，...
论独立游戏的起步立项方法论
独立游戏的成功依赖于立项阶段的清晰规划。开发者需关注可发行最小规格、财务回报率和产品定位，明确目标、合理分配资源，避免过度追求完美，以确保项目按时完成。市...
保时捷Cayenne Coupe Turbo甚至会让911车主感到紧张
保时捷新款Cayenne Coupe Turbo更紧凑且更强大，拥有1139马力和1106磅-英尺的扭矩，成为史上最强保时捷。其电动版本加速迅猛，0-60...
技嘉在COMPUTEX 2026展示多款生活美学主机
技嘉在COMPUTEX 2026展示了STEALTH系列和WOOD系列主机。STEALTH系列采用B850M AORUS主板和RTX 5090显卡，展现简...