Amazon SageMaker HyperPod 引入对 Amazon EKS 的支持
原文中文,约4300字,阅读约需11分钟。发表于: 。今天,我们很高兴地宣布,专为基础模型(FM)开发打造的高韧性基础架构 Amazon SageMaker H […]
亚马逊宣布为基础模型开发的Amazon SageMaker HyperPod引入了对Amazon Elastic Kubernetes Service(EKS)的支持,使客户能够使用EKS来编排HyperPod集群。HyperPod有助于高效扩展到一千多个AI加速器上,将训练时间减少多达40%。增强的可观测性覆盖了整个集群的资源利用情况,有助于高效完成故障排除和优化。Amazon SageMaker HyperPod成为AI初创企业和希望高效训练及部署大规模模型的企业的首选解决方案。