近年来,随着大型语言模型(LLMs)的快速发展,AI推理变得资源密集。Kubernetes成为部署推理服务的首选平台,支持多集群推理以满足全球扩展和成本控制的需求。KAITO和KubeFleet是解决多集群推理复杂性的关键工具,确保模型一致性和优化工作负载分配。
该研究提出了一种基于强化学习的分层控制器Green-DCC,旨在优化液冷数据中心集群的工作负载分配,降低碳排放。研究表明,该系统能够有效同步多个数据中心的运行,为可持续性机器学习提供框架和基准模拟。
完成下面两步后,将自动完成登录并继续当前操作。