Kthena + vLLM-Ascend:云原生大模型推理的编排与调度实践
华为云官方博客
·
介绍Kthena:云原生时代的大语言模型推理
Cloud Native Computing Foundation
·
Volcano 社区发布 Kthena 子项目 | 重新定义大模型智能推理
华为云官方博客
·