本研究提出了一种新的深度模型融合方法,称为“零-shot稀疏低秩专家(SMILE)构建”,可在不需要额外数据或进一步训练的情况下将源模型扩展为MoE模型。实验表明,SMILE在多个任务中表现出良好的适应性和可扩展性。
完成下面两步后,将自动完成登录并继续当前操作。