小红花·文摘

大型语言模型路由器架构：2026年的最佳实践

Redis Blog ·

2026年1月22日的路由泄漏事件

The Cloudflare Blog ·

AWS通过AZ亲和路由和GLIDE Valkey降低了键值数据存储的延迟和成本

InfoQ ·

微前端架构将大型应用拆分为小型独立单元，类似微服务。每个单元可由不同团队用不同框架开发、测试和部署，提升自主性和可扩展性，简化维护和调试，支持增量升级。关键点包括单元间通信、共享依赖管理和路由策略。

微前端

DEV Community ·

该论文探讨了不同粒度的混合专家（MoE）模型中的路由策略，提出了task-MoE模型，并在多语言翻译任务中表现优于传统模型。同时，研究分析了路由机制的不足，提出了改进策略以提升模型性能和效率。

层级递归路由器在专家混合中的应用

BriefGPT - AI 论文速递 ·

本文提出了一种新颖的负载均衡与局部性结合的路由策略，改进了PanGu-Sigma模型，训练时间减少12.68%至22.24%。LocMoE+通过量化和自适应路由提高训练效率，专家处理的令牌数量减少60%。StableMoE方法有效解决了路由波动问题，动态专家选择框架提升了计算效率，优化了复杂任务中的资源分配能力。

GW-MoE：应用全局工作空间理论解决 MoE 路由器中的不确定性

BriefGPT - AI 论文速递 ·

本文介绍了一种基于混合专家（MoE）的语音识别模型SpeechMoE，采用稀疏L1损失和平均重要性损失优化路由器激活。实验表明，该模型在计算成本相当的情况下，CER提高了7.0%-23.0%。研究还探讨了MoE模型在不同任务中的效率，提出了新的路由策略以减少训练时间，并发布了多种开源MoE语言模型，强调其成本效益和未来发展潜力。

Lory: 全可微的自回归语言模型预训练中的专家混合

BriefGPT - AI 论文速递 ·

本文提出了一种新颖的负载均衡与局部性相结合的路由策略，改进了PanGu-Sigma模型，训练时间减少12.68%至22.24%。研究发布了一系列开源混合专家语言模型，强调其成本效益，并提出了基于标记ID的改进策略，以提升模型设计和部署效率。

WDMoE: 无线分布式大规模语言模型与专家混合模型

BriefGPT - AI 论文速递 ·

该论文研究了不同粒度的MoE模型中的路由策略，通过任务级路由在大规模数据集上实验，能够从大型稀疏模型中提取更小、可部署的子网络。实验结果显示，task-MoE在WMT上的表现比token-MoE高1.0 BLEU，并且推理成本相同。在扩展到200种语言对时，task-MoE提高了推理吞吐量2.6倍。

利用层间专家亲和性加速混合专家模型推理

BriefGPT - AI 论文速递 ·

该论文研究了不同粒度的MoE模型中的路由策略，通过任务级路由在数据集上进行实验，能够从大型稀疏模型中提取更小、可部署的子网络。实验结果表明，task-MOE在30种语言对上的表现平均比token-MoE高1.0 BLEU，并且能够保留所有收益。同时，当扩展到200种语言对时，task-MoE表现相近，并且提高了推理吞吐量2.6倍。

令牌混合：通过跨样本聚合实现高效的 LLMs

BriefGPT - AI 论文速递 ·

该论文研究了不同粒度的MoE模型中的路由策略，通过任务级路由在大规模数据集上实验，能够从大型稀疏模型中提取可部署的子网络。实验结果表明，task-MoE在WMT上的表现比token-MoE高1.0 BLEU，且保留了所有收益和推理成本。在扩展到200种语言对时，task-MoE提高了推理吞吐量2.6倍。

基于任务的 MoE 多任务多语言机器翻译

BriefGPT - AI 论文速递 ·