Modular Blog ·

模块化平台25.7：更快的推理、更安全的GPU编程以及更统一的开发者体验

💡 原文英文，约1400词，阅读约需5分钟。

📝

内容提要

Modular Platform 25.7发布，增强了AI计算层的统一性和性能。新增开放的MAX Python API和实验性模型API，支持NVIDIA Grace超级芯片，提升开发效率。动态LoRA实现实时模型个性化，Mojo语言提高了GPU编程的安全性。此版本扩展了模型和硬件支持，推动高性能推理。

🎯

关键要点

发布Modular Platform 25.7，增强AI计算层的统一性和性能。
新增开放的MAX Python API，支持开发者更好地构建模型。
实验性模型API和开发工作流程提升了建模灵活性和易用性。
扩展了对NVIDIA Grace超级芯片的硬件支持，提升推理性能。
动态LoRA实现实时模型个性化，适用于低延迟工作负载。
Mojo语言提高了GPU编程的安全性，增强了对Apple Silicon GPU的支持。
改进了Mojo语言的错误检测和内存管理，提升开发效率。
鼓励开发者尝试新功能并参与社区讨论，推动高性能AI的发展。

❓

延伸问答

模块化平台25.7的主要更新内容是什么？

模块化平台25.7增强了AI计算层的统一性和性能，新增了开放的MAX Python API和实验性模型API，支持NVIDIA Grace超级芯片，提升开发效率。

MAX Python API的开放对开发者有什么好处？

开放的MAX Python API让开发者可以更好地构建模型，提供了更好的可见性、错误报告和贡献路径，促进快速迭代。

动态LoRA在实时模型个性化中如何应用？

动态LoRA允许开发者在运行时热插拔LoRA适配器，实现模型个性化而无需重启服务器，适用于低延迟工作负载。

Mojo语言在GPU编程中有哪些安全性改进？

Mojo语言增强了类型检查，改进了错误消息，支持使用地址消毒器识别内存泄漏和非法访问，提升了GPU编程的安全性。

模块化平台25.7如何支持NVIDIA Grace超级芯片？

模块化平台25.7扩展了对NVIDIA Grace超级芯片的硬件支持，提升了推理性能，支持bfloat16模型在ARM CPU主机上的运行。

如何开始使用模块化平台25.7的新功能？

用户可以通过安装modular包，探索开放源代码的MAX Python API，参与社区讨论，并查看开发者指南和教程。

🏷️

继续阅读

基于 Amazon ECS Fargate 和 Graviton 构建企业级多租户 AI Agent 平台：OpenClaw + Hermes 双 Agent 实践
本文介绍了基于Amazon ECS Fargate和Graviton构建的企业级多租户AI Agent平台，结合OpenClaw和Hermes两个开源Ag...
日本Datasection采用仁宝SGX30-2 AI服务器平台
日本Datasection采用仁宝的SGX30-2 AI服务器平台，以支持其AI云平台和计算基础设施的扩展，满足亚太地区对生产级AI服务的需求。
SuperX首个美国AI推理云中心在丹佛投入运营
SuperX AI Technology Limited在丹佛正式启用首个美国AI推理云中心，基于NVIDIA技术，提供高性能、低延迟的AI推理服务，已被...
[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...
Roku LT OS开源解析：从遥控器系统到电动赛车控制平台
Roku开源了Roku LT OS，旨在为开发者提供轻量化架构和高度确定性的执行能力，适用于嵌入式设备和电动赛车。该系统强调资源控制和时间可预测性，已在电...
Snowflake认为它知道究竟是什么在拖慢开发者的进度
Snowflake推出了基于AI的编码代理CoCo，旨在简化企业开发，支持自动化工作流程和应用开发。CoCo与Snowflake的数据平台深度集成，提供多...