💡
原文英文,约800词,阅读约需3分钟。
📝
内容提要
Kubernetes v1.35版本增强了AI/ML操作的可预测性,推出了工作负载感知调度、稳定的Pod资源调整和更安全的配置输出,旨在简化操作并提高资源利用率。
🎯
关键要点
- Kubernetes v1.35版本增强了AI/ML操作的可预测性,推出了工作负载感知调度、稳定的Pod资源调整和更安全的配置输出。
- v1.35版本引入了工作负载API和工作负载感知调度,支持“全或无”调度,避免了部分调度造成的资源浪费。
- Pod资源的在线调整功能在v1.35中稳定,允许在不重启容器的情况下调整CPU和内存,减少了推理服务的波动。
- 动态资源分配(DRA)被视为设备感知编排的核心构建块,继续推动设备声明的可预测性。
- v1.35将kubectl的输出格式默认设置为KYAML,以减少模糊的YAML行为和常见格式问题。
- 生产AI系统结合了不同的工作负载,需求一致的操作层面以支持调度、扩展和政策执行。
- Gartner预测到2027年底,超过40%的AI项目将被取消,推动团队需要可重复的生产路径。
- v1.35的方向支持平台团队减少定制基础设施工作,保持Kubernetes作为一致的基础。
- Ingress NGINX将在2026年3月退休,运营者需规划迁移路径并验证。
- v1.35改善了AI负载下容易出现问题的部分,提供了更简单的扩展路径。
➡️