小红花·文摘

The New Stack ·

本研究提出了一种灵敏合并方法，解决了在合并大型语言模型时保留任务专业能力的问题。通过分析参数灵敏度和任务可迁移性，优化合并系数，显著提升了多个任务的性能，尤其在代码生成方面优于专门微调的模型，为未来的模型合并策略提供了重要启示。

BriefGPT - AI 论文速递 ·