模型合并中的参数竞争平衡
原文中文,约300字,阅读约需1分钟。发表于: 。本研究解决了现有模型合并技术在多任务之间参数竞争平衡困难的问题。提出的PCB-Merging方法通过评估参数在各任务中的重要性以及任务间的相似性,实现在不重新训练的情况下有效合并多个模型,并提高了多种情况下的性能。实验结果表明,该方法在多个领域和任务上显著优于现有技术。
在大型语言模型时代,模型合并面临干扰和异构数据的挑战。Twin-Merging方法通过将知识模块化为共享和专属组件,动态合并任务特定知识,缩小与微调模型的性能差距,提高对异构数据的适应性。实验表明,该方法在判别任务中提升28.34%,在生成任务上超越微调模型。