晓飞的算法工程笔记 ·

OLOR：已开源，向预训练权值对齐的强正则化方法 | AAAI 2024 - 晓飞的算法工程笔记

💡 原文中文，约4800字，阅读约需12分钟。

📝

内容提要

随着预训练视觉模型的兴起，论文提出了一种基于权值回滚的微调方法OLOR，通过合并权值回滚项到优化器的权值更新项中，减少知识遗忘并增强微调性能。同时，采用逐层惩罚和多样化衰减率来调整不同层的权值回滚级别，适应不同的下游任务。实验证明OLOR在各种任务上具有普遍适用性和最先进的性能。

🎯

❓

OLOR方法旨在减少知识遗忘并增强微调性能。

OLOR通过将权值回滚项合并到优化器的权值更新项中，确保上下游模型权值的一致性，从而减少知识遗忘。

逐层惩罚用于调整不同层的权值回滚级别，以适应不同的下游任务，鼓励浅层提取更通用的特征。

实验表明，OLOR在图像分类、对象检测、语义分割和实例分割等任务上具有普遍适用性和最先进的性能。

与传统的线性探测和完全微调方法相比，OLOR有效减少了知识遗忘问题，提供了更好的微调性能。

权值回滚技术通过实时正则化，使当前模型权值更接近预训练权值，从而减轻过度拟合和知识遗忘。

🏷️