模型库:我们只需要一些微调的模型
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种新的通用微调方法LEVI,通过自适应地对预训练模型进行逐层集成和与小型任务专属模型相结合,有效地抑制了问题特征,保留了新任务所需的有用特征。实验证明,LEVI提高了微调的泛化能力。
🎯
关键要点
- 微调在新的下游任务中广泛应用,但面临OOD泛化挑战。
- 提出了一种新的通用微调方法LEVI。
- LEVI通过逐层集成和与小型任务专属模型结合,抑制问题特征,保留有用特征。
- LEVI在训练和推断效率上保持优势。
- 大规模实验表明LEVI显著提高了微调的泛化能力。
➡️