该研究提出了协作约束路由(C2R)策略,以提高混合专家(MoE)模型的效率,解决专家激活不平衡和通信开销过高的问题。实验结果显示,该方法在多个NLP基准测试中提升了性能,并显著降低了GPU间的通信成本。
完成下面两步后,将自动完成登录并继续当前操作。