小红花·文摘

本研究提出了一种新的混合专家模型方法，称为笛卡尔乘积路由（CartesianMoE），解决了专家之间知识共享不足的问题。实验结果表明，该方法在困惑度和下游任务性能上优于传统模型，并增强了专家路由的鲁棒性。