NVIDIA Dynamo通过与主要云服务提供商的集成及Kubernetes管理能力,支持企业进行多节点推理,提升性能与效率。其分离服务技术优化AI模型推理,在GPU集群中实现高效管理,帮助企业降低成本并加速推理服务。
KServe v0.15发布,增强了对生成AI模型的支持,新增多节点推理、LLM自动扩展和分布式KV缓存功能,提高了服务效率和可扩展性。
完成下面两步后,将自动完成登录并继续当前操作。