💡
原文英文,约800词,阅读约需3分钟。
📝
内容提要
NVIDIA和Anyscale合作,将NVIDIA AI整合到Ray开源和Anyscale平台中,以加速生成AI的开发和效率,同时提高生产AI的安全性。预计集成将在年底前推出。
🎯
关键要点
- NVIDIA与Anyscale合作,将NVIDIA AI整合到Ray开源和Anyscale平台中。
- 集成将加速生成AI的开发和效率,同时提高生产AI的安全性。
- Anyscale推出的新服务Anyscale Endpoints,便于开发者将LLM嵌入应用。
- 集成支持多种开源模型,包括Code Llama、Falcon、Llama 2等。
- NVIDIA TensorRT-LLM软件将提升LLM性能和效率,提供成本节约。
- TensorRT-LLM支持多GPU并行推理,性能可提高至8倍。
- NVIDIA Triton推理服务器支持多种设备上的推理,提升AI模型部署效率。
- Ray用户可使用NVIDIA NeMo框架轻松微调和定制LLM。
- Anyscale平台提供企业级统一计算,帮助快速构建和管理AI应用。
- 开发者可在混合云或多云环境中轻松扩展计算能力。
- NVIDIA与Anyscale的集成预计将在年底前推出。
➡️