Pcb-Merging:无需训练的多任务模型合并方案 | NeurIPS'24 - 晓飞的算法工程笔记

晓飞的算法工程笔记 晓飞的算法工程笔记 ·

论文提出了一种新方法 exttt{Pcb-Merging},通过平衡参数竞争优化模型合并,提升性能而无需额外训练。该方法评估参数的重要性和相似性,舍弃低分参数并进行重新缩放,适用于多种任务和领域,显著超越现有技术。

原文中文,约3300字,阅读约需8分钟。
阅读原文