AdaMerging:多任务学习的自适应模型融合
原文中文,约300字,阅读约需1分钟。发表于: 。本文介绍了一种创新技术称为自适应模型融合(AdaMerging),该方法通过无监督任务算术方案自动学习模型融合的系数,既可以在任务层面上,也可以在层级层面上,而无需依赖原始训练数据。实验结果表明,与当前最先进的任务算术融合方案相比,AdaMerging 在性能上有显著的 11% 改进,并且在应用于未见过的下游任务时表现出更好的泛化能力,同时还显著提高了对数据分布漂移的鲁棒性。
本文介绍了自适应模型融合(AdaMerging)技术,通过无监督任务算术方案自动学习模型融合的系数,无需依赖原始训练数据。实验结果表明,AdaMerging 在性能上有显著的11%改进,并且在应用于未见过的下游任务时表现出更好的泛化能力和鲁棒性。