小红花·文摘

该研究提出了协作约束路由(C2R)策略，以提高混合专家(MoE)模型的效率，解决专家激活不平衡和通信开销过高的问题。实验结果显示，该方法在多个NLP基准测试中提升了性能，并显著降低了GPU间的通信成本。