Volcano 社区发布 Kthena 子项目 | 重新定义大模型智能推理

📝

内容提要

它旨在解决在生产环境中大规模编排、部署和服务 LLM 所面临的核心挑战,通过其独特的 超节点拓扑感知的亲和性调度,KV Cache 感知的流量调度、Prefill/Decode 分离路由等高级功能,显著提升 GPU/NPU...

🏷️

标签