Modular Blog ·

Modular：Modular 26.4：SOTA MoE服务、通过代理技能进行模型启动、Mojo 1.0 Beta 2及更多

💡 原文英文，约1000词，阅读约需4分钟。

📝

内容提要

Modular 26.4版本推出，支持MiniMax M3和GLM 5.2等前沿模型，增强了模型架构和API兼容性。新功能包括稀疏激活的Mixture-of-Experts（MoE）架构，提升了性能和开发体验。用户可通过Modular Cloud访问500多种模型架构，支持多种应用场景。

🎯

🔎

Modular 26.4引入的稀疏激活Mixture-of-Experts（MoE）架构，虽然提升了模型性能，但也带来了服务复杂性。由于模型参数庞大，只有部分参数在运行时激活，这要求云端与内核之间进行更复杂的优化，开发者需关注这一点以确保高效运行。

新版本中引入的导入模型和调试模型技能，使开发者能够更轻松地将自己的模型集成到MAX中。这一功能不仅加速了模型的部署过程，还为开发者提供了更灵活的开发体验，值得开发者积极尝试。

随着Mojo 1.0 Beta 2的发布，Modular在稳定性和功能上不断进步。用户应关注即将推出的稳定接口标记，这将为开发者提供更清晰的使用指引，帮助他们更好地利用Mojo的潜力。

❓

Modular 26.4版本支持MiniMax M3、GLM 5.2和Kimi 2.7等新模型，增强了模型架构和API兼容性，并引入了稀疏激活的Mixture-of-Experts（MoE）架构。

Mixture-of-Experts（MoE）架构是一种模型架构，虽然模型参数数量庞大，但在任何时刻只有少数参数处于激活状态，从而提高了性能和效率。

用户可以使用导入模型和调试模型技能，通过npx skills add modular/skills命令将自己的模型导入MAX，快速实现模型的部署。

Modular Cloud支持多种应用场景，包括代理编码、多轮对话、视觉和视频生成等，用户可以访问500多种模型架构。

Mojo 1.0 Beta 2专注于精炼和稳定性，增加了稳定接口的标记，并进行了多项语言改进。

通过增强模型架构、改进量化和推测解码能力，以及扩展OpenAI API兼容性，Modular 26.4版本提升了开发者的使用体验。

🏷️