Volcano新版本发布:10大功能提升统一调度和细粒度资源管理能力

💡 原文中文,约11800字,阅读约需29分钟。
📝

内容提要

Volcano是CNCF首个云原生批量计算项目,支持AI和大数据等高性能计算。最新v1.10.0版本新增队列优先级、细粒度GPU管理、Pod调度准备性和Sidecar容器调度等功能,提升安全性和性能,并兼容Kubernetes v1.30。优化了GPU监控和helm chart安装,提升资源利用效率和用户体验。

🎯

关键要点

  • Volcano是CNCF首个云原生批量计算项目,支持AI和大数据等高性能计算。

  • v1.10.0版本新增队列优先级、细粒度GPU管理、Pod调度准备性和Sidecar容器调度等功能。

  • 新增队列优先级设置策略,用户可直接设置队列优先级以控制作业调度顺序。

  • 支持细粒度的GPU资源共享与回收,允许上报不同型号的GPU资源。

  • Pod Scheduling Readiness调度功能,优化Pod调度时机,减少资源浪费。

  • 支持Sidecar容器调度,确保Sidecar容器在业务容器之前启动。

  • 增强vcctl命令行工具功能,支持更多操作和查询功能。

  • Volcano支持Kubernetes v1.30,保证功能和可靠性。

  • 增强Volcano安全性,遵循开源软件供应链安全规范,收缩RBAC权限。

  • 优化Volcano性能,降低API Server压力,提升任务提交效率。

  • 提升GPU监控功能,优化监控指标,提供更直观的GPU资源使用情况。

  • 优化helm chart包安装升级流程,支持更多自定义参数和设置。

延伸问答

Volcano v1.10.0版本新增了哪些主要功能?

新增队列优先级、细粒度GPU管理、Pod调度准备性和Sidecar容器调度等功能。

如何设置Volcano中的队列优先级?

用户可以直接设置队列的priority字段,priority值越高,队列优先级越高。

Volcano如何支持细粒度的GPU资源管理?

Volcano支持上报不同型号的GPU资源,允许细粒度的共享与回收。

Pod Scheduling Readiness功能的作用是什么?

该功能优化Pod调度时机,减少资源浪费,确保Pod在合适的时机被调度。

Volcano v1.10.0版本如何增强安全性?

遵循开源软件供应链安全规范,收缩RBAC权限,提升系统安全性。

如何优化Volcano的性能?

通过降低vcjob更新频次、使用共享informer等方式来减少API Server压力。

➡️

继续阅读