💡 原文英文,约700词,阅读约需3分钟。
📝

内容提要

Salesforce成功将1000多个EKS集群从Kubernetes Cluster Autoscaler迁移至Karpenter,提升了扩展速度和资源利用率,降低了运营成本。通过定制工具和自动化流程,解决了节点替换和工作负载调度的挑战,实现了80%的运营开销减少和5%的成本节省,为其他企业提供了自动化扩展的成功案例。

🎯

关键要点

  • Salesforce成功将1000多个EKS集群从Kubernetes Cluster Autoscaler迁移至Karpenter。
  • 迁移旨在减少扩展延迟、简化操作、降低成本,并为内部开发者提供更灵活的自助基础设施。
  • Salesforce平台团队开发了定制工具,以安全可靠地管理迁移,解决了节点替换和工作负载调度的挑战。
  • 迁移过程从2025年中期开始,经过测试和验证,2026年初正式投入生产。
  • 通过迁移,Salesforce解决了配置错误、标签长度限制和工作负载模式等操作挑战。
  • 采用Karpenter后,集群扩展延迟从分钟减少到秒,节点利用率提高,运营开销减少约80%。
  • 初步结果显示2026财年节省约5%的成本,预计2027财年进一步减少5-10%。
  • Salesforce的迁移反映了大规模Kubernetes操作中的趋势,传统的自动扩展机制难以应对动态工作负载。
  • 其他组织如Coinbase和BMW Group也在向Karpenter过渡,面临类似的结构性挑战。
  • Salesforce的迁移强调了在企业规模上进行自动化转换所需的定制工具和操作纪律。
  • Salesforce的经验为其他考虑类似迁移的组织提供了蓝图,展示了自动化的联邦自动扩展可以带来显著的性能和成本效率提升。