💡
原文英文,约900词,阅读约需4分钟。
📝
内容提要
MAX 25.1是AI发展的重要更新,增强了代理和LLM工作流程,推出了MAX Builds作为GenAI模型和应用的中心。新版本支持GPU加速嵌入、OpenAI兼容的函数调用和高性能优化。开发者可通过夜间发布模式提前体验新功能,提升性能和灵活性。
🎯
关键要点
- MAX 25.1是AI发展的重要更新,增强了代理和LLM工作流程。
- 推出了MAX Builds,作为GenAI模型和应用的中心。
- 新版本支持GPU加速嵌入、OpenAI兼容的函数调用和高性能优化。
- 开发者可以通过夜间发布模式提前体验新功能,提升性能和灵活性。
- MAX 25.1提供了离线批量推理、Mojo驱动的GPU编程和从本地到云的简化部署。
❓
延伸问答
MAX 25.1的主要更新内容是什么?
MAX 25.1增强了代理和LLM工作流程,推出了MAX Builds,并支持GPU加速嵌入和OpenAI兼容的函数调用。
开发者如何提前体验MAX 25.1的新功能?
开发者可以通过夜间发布模式提前体验MAX 25.1的新功能。
MAX Builds的功能是什么?
MAX Builds是GenAI模型和应用的中心,提供最新的模型、社区创建的包和应用食谱。
MAX 25.1如何提高AI模型的性能?
MAX 25.1通过分页注意力、前缀缓存和离线批量推理等技术提高AI模型的性能。
MAX 25.1支持哪些编程接口?
MAX 25.1支持Mojo驱动的GPU编程和OpenAI兼容的函数调用。
MAX 25.1的离线推理功能有什么优势?
离线批量推理可以改善延迟和加载时间,提高整体效率。
➡️