Modular Blog ·

模块化平台25.5：推出大规模批量推理

💡 原文英文，约900词，阅读约需3分钟。

📝

内容提要

Modular Platform 25.5推出了大规模批量推理API，支持高效AI性能，兼容NVIDIA和AMD硬件。新版本还包括开源的MAX Graph API和独立的Mojo Conda包，简化GPU开发与部署，MAX图可无缝集成到PyTorch中，提升性能。

🎯

❓

模块化平台25.5推出了大规模批量推理API，支持高效AI性能，并兼容NVIDIA和AMD硬件。

大规模批量推理API由Mammoth驱动，能够高效分配GPU集群资源，保持90%以上的利用率。

Mojo包提供了AI独立的CPU和GPU内核开发所需的所有工具，便于开发者使用。

开源的MAX Graph API允许用户在Python中构建可移植的GPU加速图形，支持模型的快速移植。

MAX图可以无缝集成到PyTorch工作流中，使用@graph_op装饰器将MAX图自动包装为自定义PyTorch操作。

新版本通过优化的Docker容器和独立的Mojo Conda包简化了GPU开发与部署。

🏷️

基于 Amazon ECS Fargate 和 Graviton 构建企业级多租户 AI Agent 平台：OpenClaw + Hermes 双 Agent 实践
本文介绍了基于Amazon ECS Fargate和Graviton构建的企业级多租户AI Agent平台，结合OpenClaw和Hermes两个开源Ag...
日本Datasection采用仁宝SGX30-2 AI服务器平台
日本Datasection采用仁宝的SGX30-2 AI服务器平台，以支持其AI云平台和计算基础设施的扩展，满足亚太地区对生产级AI服务的需求。
SuperX首个美国AI推理云中心在丹佛投入运营
SuperX AI Technology Limited在丹佛正式启用首个美国AI推理云中心，基于NVIDIA技术，提供高性能、低延迟的AI推理服务，已被...
Roku LT OS开源解析：从遥控器系统到电动赛车控制平台
Roku开源了Roku LT OS，旨在为开发者提供轻量化架构和高度确定性的执行能力，适用于嵌入式设备和电动赛车。该系统强调资源控制和时间可预测性，已在电...
为何自主智能使运营平台成为企业中最重要的层级
企业在人工智能应用中面临的主要挑战是运营复杂性。Hewlett Packard Enterprise的Latha Vishnubhotla指出，基础设施的...
奥迪 R8 继任者发布！大 V8+千匹马力，走的却是复古风
奥迪重新走向「运动」#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。