小红花·文摘

Apple Machine Learning Research ·

该研究使用稀疏专家混合（SMoE）模型处理多领域神经机器翻译数据，并发现简单的宽度扩展可以达到相同的性能水平。研究还提出了领域随机化技术来提高多领域系统的鲁棒性。

BriefGPT - AI 论文速递 ·

研究人员探索了稀疏专家混合模型在不同关键因素下的泛化误差，并提供了使用稀疏性来提高混合模型泛化性能的见解。

BriefGPT - AI 论文速递 ·

KDnuggets ·