Modular Blog ·

模块化：MAX 25.2：释放您H200的强大性能——无需CUDA！

💡 原文英文，约1100词，阅读约需4分钟。

📝

内容提要

MAX 25.2更新了无CUDA语言模型，支持多GPU和500多个GenAI模型，提升了性能和部署速度。新特性包括改进的LLM服务、超小容器和Mojo编程，简化了GPU编程，适用于各种AI应用。

🎯

❓

MAX 25.2更新了无CUDA语言模型，支持多GPU和500多个GenAI模型，提升了性能和部署速度。

可以通过简单的命令在多GPU上运行大型语言模型，例如使用4个GPU运行70B参数模型。

MAX 25.2新增了500多个预配置的GenAI模型，包括Qwen2、Microsoft Phi和Exaone等。

Mojo编程简化了GPU编程，提供现代语言特性，适合AI研究者和开发者，能够直接访问NVIDIA GPU。

通过改进的调度、批处理和缓存，MAX 25.2提升了LLM服务的性能，某些基准测试中提高了10%的吞吐量。

新的超小Docker容器压缩后仅1.3GB，支持快速部署，适合大型模型的快速上线。

🏷️

提高`nvptx64-nvidia-cuda`目标的基准
Rust 1.97将于2026年7月9日发布，更新nvptx64-nvidia-cuda目标的PTX ISA版本，移除对2017年及之前GPU架构的支持。...
五月来了：本月16款游戏登陆云端，NVIDIA GeForce RTX 5080性能再升级
本月，GeForce NOW将新增16款游戏，包括《极限竞速：地平线6》和《007：第一光》。Ultimate会员可享受RTX 5080级别的云游戏性能。...
使用AI Max调整您的购物广告活动以适应现代搜索
谷歌推出了AI Max for Shopping，旨在帮助零售商提升购物广告策略。该工具利用商户中心的数据，用户可一键升级，保留现有的产品定位和出价灵活性...
AI Max迎来一周年，推出新方式以提升表现并扩展至更多广告客户
谷歌推出AI Max，旨在帮助零售商在顾客搜索前满足购物和旅游广告需求。该工具利用商户中心数据生成动态广告，能够捕捉复杂搜索。AI Brief功能允许用户...
LWiAI播客第242期 - ChatGPT图像2.0，Qwen 3.6 Max，Kimi-K2.6
本期播客讨论了最新的AI新闻，包括OpenAI发布的ChatGPT图像2.0模型，生成文本和截图的能力显著提升；阿里巴巴推出Qwen 3.6 Max，转为...
游戏性能旗舰最强之选，一加Ace 6至尊版国补到手价2999元起
一加于2026年发布了Ace 6至尊版，搭载天玑9500芯片，专为游戏优化，支持165Hz超高帧率。配备8600mAh电池和120W闪充，具备IP66/I...