Kubernetes WG Serving 组已解散,专注于支持Kubernetes上的AI推理工作。该组收集了模型服务器和硬件提供商的需求,推动了负载均衡和工作负载的演变。未解决的问题已转交给llm-d项目,继续推进推理需求。感谢所有参与者的贡献。
完成下面两步后,将自动完成登录并继续当前操作。