Cloud Native Computing Foundation ·

Kubernetes WG Serving 在成功推进 AI 推理支持后宣布解散

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

Kubernetes WG Serving 组已解散，专注于支持Kubernetes上的AI推理工作。该组收集了模型服务器和硬件提供商的需求，推动了负载均衡和工作负载的演变。未解决的问题已转交给llm-d项目，继续推进推理需求。感谢所有参与者的贡献。

🎯

🔎

Kubernetes WG Serving组的解散标志着其在AI推理支持方面的目标已基本实现。该组通过收集不同利益相关者的需求，推动了Kubernetes作为推理工作负载平台的演变。这一过程不仅促进了负载均衡的改进，也为后续的工作组提供了宝贵的经验和基础。

未解决的问题已转交给llm-d项目，表明该项目在推动推理需求方面的重要性。llm-d旨在整合基础设施与机器学习生态系统，为Kubernetes的SIGs提供更清晰的需求方向。这种转移有助于确保推理工作负载的持续发展与优化。

随着WG Serving的解散，相关的工作将迁移到其他工作组或SIGs。这意味着Kubernetes的AI推理支持将继续在不同的领域中得到关注，尤其是在自动扩展和多节点工作方面。关注这些转移将有助于理解Kubernetes在AI领域的未来发展。

❓

WG Serving 组解散是因为其目标已实现，即支持Kubernetes上的AI推理工作。

WG Serving 组推动了负载均衡和工作负载的演变，并制定了Kubernetes AI一致性要求。

未解决的问题已转交给llm-d项目，继续推进推理需求。

llm-d项目旨在提供实现先进推理的清晰路径，并为现有推理用户平台提供建议。

AIBrix提供了一个完整的平台解决方案，用于成本高效的LLM推理。

WG Serving 组的所有当前工作可以迁移到其他工作组或直接到SIGs。

🏷️