Modular Blog ·

模块化：推出MAX 24.6：一个GPU原生的生成AI平台

💡 原文英文，约1200词，阅读约需5分钟。

📝

内容提要

三年前，我们开始重塑AI基础设施，以应对技术挑战。今天推出的MAX 24.6包含MAX GPU，这是首个垂直集成的生成AI服务栈，消除了对特定计算库的依赖。MAX Engine和MAX Serve支持灵活的推理部署，简化了AI开发流程。我们期待在2025年继续推动AI基础设施的进步。

🎯

❓

MAX 24.6包含首个垂直集成的生成AI服务栈MAX GPU，支持灵活的推理部署，简化AI开发流程。

MAX Engine支持在多种硬件平台上灵活推理部署，允许开发者在本地实验并无缝扩展到云环境。

MAX 24.6提供统一的平台，支持整个开发体验，减少了AI基础设施的复杂性，避免了对特定计算库的依赖。

MAX GPU在NVIDIA A100上实现了高吞吐量，性能持续提升，支持多种量化方法。

开发者可以尝试MAX 24.6的早期技术预览，运行Llama 3并探索其功能。

到2025年，MAX将继续扩展GPU技术栈，提升性能和可移植性，并支持更多生成AI模式。

🏷️

日本Datasection采用仁宝SGX30-2 AI服务器平台
日本Datasection采用仁宝的SGX30-2 AI服务器平台，以支持其AI云平台和计算基础设施的扩展，满足亚太地区对生产级AI服务的需求。
这家人工智能初创公司声称能够判断一个剧本是否会成为热门电影
When Quilty hit the industry trades earlier this year, the AI startup promise...
有人靠CPU把AI算力密度卷到了新高度
英特尔推出新技术以应对Agentic AI的算力焦虑，提升AI算力密度，推动数据中心和AI的发展。
您的AI费用失控了。Cloudflare现在可以解决这个问题。
Cloudflare推出AI Gateway，帮助企业控制AI支出。新功能包括预算限制和身份驱动的支出管理，允许按用户、团队或模型设置预算。通过集中管理，...
2026年数据与AI峰会：金融服务领导者的内部指南
2026年数据与AI峰会将于6月15日至18日在旧金山举行，聚焦金融服务行业的AI转型与现代化，主要议题包括保险承保、负责任的AI应用及资本市场智能化。与...
Presentation: Platform Teams Enabling AI - MCP/Multi-Agentic Tools Across Linkedin
LinkedIn’s Karthik Ramgopal and Prince Valluri discuss leveraging AI as a new...