小红花·文摘

KServe加入CNCF，标准化Kubernetes上的AI模型服务

The New Stack ·

构建高效的云原生大语言模型推理框架：KServe、vLLM、llm-d 和 WG Serving

云原生 ·

您是否正在尝试在 Kubernetes 上大规模管理 AI 工作负载？也许正在部署复杂的 AI 堆栈，如 Kubeflow 和 KServe？以下是 Sveltos 如何实现多集群、GitOps 驱动的 MLOps

DEV Community ·

KServe是一个在Kubernetes上的推理平台，专为高度可扩展的场景而构建。它支持现代Serverless推理工作负载，可以在任意框架上提供机器学习模型服务。KServe提供高性能、高度抽象的接口，支持常见的ML框架，并封装了自动缩放、网络、健康检查和服务配置的复杂性。KServe考虑使用Fluid来提供弹性支持，Fluid是一个开源的Kubernetes原生的分布式数据集编排和加速引擎，可以服务于云原生场景下的数据密集型应用。阿里云容器服务团队和KServe、Fluid社区一起探索在阿里云Serverless Kubernetes平台上支持大型语言模型的简单、方便、高性能、生产级别的部署。他们提供了一些实践步骤，包括开启KServe on ASM功能、安装ACK-Fluid并开启AI模型缓存加速、部署AI模型推理服务等。最后，他们进行了性能基准测试，发现Fluid可以大幅提升KServe的冷启动速度，特别是在大型语言模型的场景下。

KServe + Fluid 加速大模型推理

阿里云云栖号 ·

此存储库包含一个完全可部署的环境，用于使用 Apache Airflow、MLFlow 和 KServe 执行 MLOps。我们假设您具有以下条件：访问具有至少 4 个 CPU 内核和 20Gb 的 Kubernetes 1.22+ 集群用作功能存储和工件存储的 Azure 存储帐户您机器上最新版本的 Anaconda Kubectl 必须安装在你的机器上 ...

mlflow + airflow + kserve的MLOps设置案例

极道 ·

KServe加入CNCF，标准化Kubernetes上的AI模型服务

KServe成为CNCF孵化项目

构建高效的云原生大语言模型推理框架：KServe、vLLM、llm-d 和 WG Serving

宣布KServe v0.15：推动生成AI模型服务

您是否正在尝试在 Kubernetes 上大规模管理 AI 工作负载？也许正在部署复杂的 AI 堆栈，如 Kubeflow 和 KServe？以下是 Sveltos 如何实现多集群、GitOps 驱动的 MLOps

KServe 提供商在云和数据中心中提供灵活的推理服务

KServe + Fluid 加速大模型推理

mlflow + airflow + kserve的MLOps设置案例