小红花·文摘

机器之心 ·

本研究提出了一种名为“升级指令调优”（UpIT）的方法，解决将稠密模型转化为专家混合模型（MoE）时的数据需求问题。通过利用稠密模型的中间检查点灵活扩展专家数量，并结合遗传算法与参数合并，确保专家多样性。实验结果表明，UpIT在不同数据规模和设置下提高了数据效率和专家多样性。

BriefGPT - AI 论文速递 ·