Volcano 社区发布 Kthena 子项目 | 重新定义大模型智能推理
📝
内容提要
它旨在解决在生产环境中大规模编排、部署和服务 LLM 所面临的核心挑战,通过其独特的 超节点拓扑感知的亲和性调度,KV Cache 感知的流量调度、Prefill/Decode 分离路由等高级功能,显著提升 GPU/NPU...
🏷️
它旨在解决在生产环境中大规模编排、部署和服务 LLM 所面临的核心挑战,通过其独特的 超节点拓扑感知的亲和性调度,KV Cache 感知的流量调度、Prefill/Decode 分离路由等高级功能,显著提升 GPU/NPU...