调整预训练骨干网络以应对表现性
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
预训练和微调是深度学习的标准,但预训练数据中的标签噪声可能影响模型泛化。研究发现,轻微噪声有利于域内性能但损害域外性能。本文提出NMTune方法,通过对齐特征空间减少噪声影响,提升泛化能力。实验验证了该方法在视觉和语言模型上的有效性,强调了学习噪声模型的重要性。
🎯
关键要点
-
预训练和微调是深度学习的标准实践。
-
预训练数据中的标签噪声可能对模型的泛化产生不利影响。
-
轻微噪声有利于域内性能,但会损害域外性能。
-
提出NMTune方法,通过对齐特征空间减少噪声影响。
-
NMTune方法提升了模型在域内和域外任务上的泛化能力。
-
实验验证了NMTune在视觉和语言模型上的有效性。
-
强调学习噪声模型的重要性。
➡️