Pcb-Merging:无需训练的多任务模型合并方案 | NeurIPS'24 - 晓飞的算法工程笔记
原文中文,约3300字,阅读约需8分钟。发表于: 。来源:晓飞的算法工程笔记 公众号,转载请注明出处 论文: Parameter Competition Balancing for Model Merging 论文地址:https://arxiv.org/abs/2410.02396 论文代码:https://github.com/duguodong
论文提出了一种新方法 exttt{Pcb-Merging},通过平衡参数竞争优化模型合并,提升性能而无需额外训练。该方法评估参数的重要性和相似性,舍弃低分参数并进行重新缩放,适用于多种任务和领域,显著超越现有技术。