小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
超越批处理:Volcano演变为AI原生统一调度平台

随着大型语言模型的发展,Kubernetes成为智能系统的重要平台。新功能如Volcano v1.14、Kthena v0.3.0和AgentCube提升了资源调度效率,简化了大模型部署,并支持异构自动扩展,推动AI基础设施进步。

超越批处理:Volcano演变为AI原生统一调度平台

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-23T08:00:00Z
Volcano v1.14 重磅发布!迈向 AI 统一调度新纪元

Volcano v1.14发布,提升AI调度能力,支持多调度器架构和Agent Scheduler,满足批量计算与延迟敏感需求。增强网络拓扑感知,支持通用操作系统,集成昇腾vNPU,扩展多集群能力,改善用户体验。

Volcano v1.14 重磅发布!迈向 AI 统一调度新纪元

华为云官方博客
华为云官方博客 · 2026-02-13T07:52:36Z
介绍Kthena:云原生时代的大语言模型推理

Kthena是Volcano社区推出的子项目,旨在为全球开发者和MLOps工程师提供高效的云原生大语言模型推理调度解决方案。它通过拓扑感知调度和智能路由优化GPU/NPU资源利用,降低延迟,简化Kubernetes上大语言模型的部署。Kthena支持多模型管理和动态扩展,提高AI生命周期的整体效率。

介绍Kthena:云原生时代的大语言模型推理

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-01-28T15:00:00Z
重磅!Volcano发布AgentCube,构建AI Agent时代的云原生基础设施

AgentCube是基于Volcano的AI智能体编排层,旨在解决Kubernetes在高并发、低延迟AI工作负载中的不足。它通过预热池机制加速启动,提升调度效率,并引入会话管理和Serverless弹性伸缩,支持多种Agent框架,推动AI基础设施发展。

重磅!Volcano发布AgentCube,构建AI Agent时代的云原生基础设施

华为云官方博客
华为云官方博客 · 2026-01-14T03:37:02Z
Volcano 社区发布 Kthena 子项目 | 重新定义大模型智能推理

Volcano推出Kthena,一个专为Kubernetes设计的高性能LLM推理调度系统,旨在提高GPU/NPU资源利用率,简化多模型管理,解决资源利用率低、延迟与吞吐量难以兼顾的问题,推动云原生AI生态发展。

Volcano 社区发布 Kthena 子项目 | 重新定义大模型智能推理

华为云官方博客
华为云官方博客 · 2026-01-05T02:04:58Z
Volcano v1.13 重磅发布!大模型训练与推理等调度能力全面增强

Volcano v1.13版本发布,增强了大模型训练与推理调度能力,支持LWS、Cron任务管理和网络拓扑发现,提升了AI计算框架的兼容性,简化了复杂工作负载管理,旨在提供高效稳定的计算平台。

Volcano v1.13 重磅发布!大模型训练与推理等调度能力全面增强

华为云官方博客
华为云官方博客 · 2025-10-17T06:12:41Z
Kong发布了Volcano,一个基于MCP的AI代理构建SDK

Kong在2025年API峰会上发布了名为Volcano的开源SDK,旨在简化AI代理的开发。该SDK采用MCP原生方法,支持多种模型,能够自动生成订单。Kong希望通过开源Volcano为开发者提供更好的工具,促进MCP代理的构建。

Kong发布了Volcano,一个基于MCP的AI代理构建SDK

The New Stack
The New Stack · 2025-10-15T17:00:33Z
iFLYTEK凭借Volcano在可扩展AI基础设施突破方面的成功案例赢得CNCF终端用户案例研究大赛

iFLYTEK在2025年KubeCon + CloudNativeCon中国大会上展示了利用Volcano优化大规模AI模型训练的案例,通过弹性调度和多租户隔离,提高了GPU利用率,降低了基础设施成本,加快了训练速度。

iFLYTEK凭借Volcano在可扩展AI基础设施突破方面的成功案例赢得CNCF终端用户案例研究大赛

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2025-06-10T01:00:00Z
Kubernetes上的批调度:比较Apache YuniKorn、Volcano.sh和Kueue

批处理在现代数据处理和机器学习中至关重要。Kubernetes虽然最初用于长时间运行的服务,但现已支持批处理工作负载。本文探讨了Kubernetes上的批调度及其挑战,并比较了三种开源工具:Apache YuniKorn、Volcano.sh和Kueue,以有效管理资源和任务依赖。选择合适的工具可提升Kubernetes的批处理能力。

Kubernetes上的批调度:比较Apache YuniKorn、Volcano.sh和Kueue

DEV Community
DEV Community · 2025-05-26T12:39:49Z

Volcano v1.11更新聚焦于AI与大数据,推出网络拓扑感知调度和多集群AI作业调度等新特性,显著提升训练与推理性能,优化资源利用率,支持动态资源分配,确保在线业务高可用性,成为云原生批量计算的新标杆。

Volcano v1.11发布,显著提升AI训练与推理任务的性能

华为云官方博客
华为云官方博客 · 2025-02-08T03:31:49Z

Volcano推出云原生混部解决方案,通过资源隔离与共享提升资源利用率。在线和离线业务混合部署在同一集群,利用在线业务的波动动态分配资源。支持多种调度策略和Qos模型,保障在线业务优先级。方案已在华为终端云应用,提高了资源利用率和调度效率。未来将增强OS接口扩展性,支持更多操作系统。

深度解析云原生混部解决方案

华为云官方博客
华为云官方博客 · 2024-10-16T03:37:10Z

Volcano是CNCF首个云原生批量计算项目,支持AI和大数据等高性能计算。最新v1.10.0版本新增队列优先级、细粒度GPU管理、Pod调度准备性和Sidecar容器调度等功能,提升安全性和性能,并兼容Kubernetes v1.30。优化了GPU监控和helm chart安装,提升资源利用效率和用户体验。

Volcano新版本发布:10大功能提升统一调度和细粒度资源管理能力

华为云官方博客
华为云官方博客 · 2024-09-25T03:22:28Z

本文介绍了如何制作和推送nccl-test镜像,并使用Volcano Job运行nccl-test进行测试。同时还提供了清理环境和解决常见问题的方法。

使用 Volcano 运行 nccl-test

陈少文的博客
陈少文的博客 · 2024-08-11T00:00:00Z
spark-operator源码解析

Apache Spark的Kubernetes Operator简化了在Kubernetes上运行Spark应用程序的过程,使用自定义资源指定、运行和显示应用程序状态。支持使用volcano作为调度器解决Kubernetes调度器问题。

spark-operator源码解析

祈雨的博客
祈雨的博客 · 2024-07-27T16:00:00Z

华为云社区发布了Volcano社区v1.9.0版本,增强了队列能力和调度稳定性,新增了弹性队列容量调度、亲和调度、GPU共享支持节点打分调度等特性,修复了问题,提升了稳定性。

Volcano社区新版本发布!7大功能全面增强队列能力与调度稳定性

华为云官方博客
华为云官方博客 · 2024-05-24T01:34:09Z

Volcano是华为开源的基于Kubernetes的资源调度系统,支持gang scheduling、调度队列和硬件感知等特点。安装方法为添加Helm Repo并安装指定版本。相关CRD列表包括commands.bus.volcano.sh、jobflows.flow.volcano.sh等。Job Plugins可定制Pod运行,包括ssh、env和svc插件。配置Deployment使用Volcano控制资源使用,创建队列和Deployment。配置Job使用Volcano限流并发执行,创建Job并设置policies。

Volcano 使用基础

陈少文的博客
陈少文的博客 · 2024-03-24T00:00:00Z
The German Tesla plant fire is claimed by far-left ‘Volcano Group’

Tesla’s Gigafactory has been targeted by environmental activists who oppose plans to expand the facility. | Photo by Sean Gallup / Getty Images A group of left-wing extremists has claimed...

The German Tesla plant fire is claimed by far-left ‘Volcano Group’

The Verge
The Verge · 2024-03-06T15:11:49Z

本文介绍了基于volcano实现节点真实负载感知调度的方案,通过volcano调度插件和Prometheus获取节点真实负载情况,提高集群负载均衡。开启负载感知调度需要安装Volcano和CCE云原生监控插件,并进行相关配置。验证结果表明开启负载感知调度后,负载能够调度到真实负载低的节点。

基于volcano实现节点真实负载感知调度

华为云官方博客
华为云官方博客 · 2024-01-30T08:22:44Z

华为云社区发布了云原生批量计算引擎Volcano社区v1.8.0版本,新增了vGPU调度和隔离、JobFlow工作流编排引擎等功能,优化了通用服务调度能力和监控系统。Volcano已有590+全球开发者参与社区贡献。

云原生批量计算引擎 Volcano社区v1.8.0版本正式发布

华为云官方博客
华为云官方博客 · 2023-08-23T08:58:01Z
STOmics 系列 2 – Cromwell 和 Volcano 集成技术详解

Cromwell是一个流行的开源工具,用于管理和执行基于工作流的数据分析任务。它支持多种计算环境,包括本地计算机、云计算和高性能计算集群。Volcano是基于Kubernetes的容器批量计算平台,主要用于高性能计算场景。本文介绍了如何将Cromwell和Volcano集成,并演示了如何使用Cromwell在Amazon EKS上运行GATK4 HaplotypeCaller的生信流程。

STOmics 系列 2 – Cromwell 和 Volcano 集成技术详解

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2023-07-26T02:48:17Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码