标签

 eks 

相关的文章:

本列表汇集了关于 Amazon EKS 的最新监控、优化和安全实践,帮助用户提升 Kubernetes 集群的性能与安全性。

利用托管服务为Amazon EKS实现监控

In this post, we show you how to implement comprehensive monitoring for Amazon Elastic Kubernetes Service (Amazon EKS) workloads using AWS managed services. This solution demonstrates building an...

本文介绍了如何利用AWS托管服务为Amazon EKS工作负载实现全面监控。通过结合EKS Auto Mode和AWS Fargate,提供灵活的计算选项和企业级可观察性,解决计算管理复杂性和可观察性缺口等问题。使用Amazon Managed Service for Prometheus、AWS X-Ray和CloudWatch等服务,构建智能扩展的现代监控解决方案。

利用托管服务为Amazon EKS实现监控
原文英文,约2700词,阅读约需10分钟。发表于:
阅读原文
原文英文,约900词,阅读约需3分钟。发表于:
阅读原文

在 Amazon EKS 上使用 DeepSpeed 进行 Llama 2 分布式训练

本篇成功地在 Amazon EKS 上使用 DeepSpeed 框架训练 LLama2 大语言模型,方案结合 Kubeflow 进行任务编排,DeepSpeed 的 ZeRO 优化器有效降低了内存占用, 利用 EFA 网络加速节点间通信,实现高效 GPU 资源调度和低延迟数据传输,为企业级模型训练提供可扩展解决方案。

近年来,深度学习模型日益复杂,单机训练效率低下。分布式训练技术可将负载分散到多台机器上,常用框架包括DeepSpeed和Horovod。本文介绍如何在亚马逊云上使用DeepSpeed进行Llama 2的分布式训练,涵盖环境搭建、Docker镜像构建及训练代码准备,以实现高效模型训练。

在 Amazon EKS 上使用 DeepSpeed 进行 Llama 2 分布式训练
原文中文,约15900字,阅读约需38分钟。发表于:
阅读原文

AWS通过GuardDuty推出EKS扩展威胁检测

AWS has expanded GuardDuty’s threat detection capabilities on EKS clusters, introducing new runtime monitoring features that use a managed eBPF agent to detect container-level threats. By Matt Foster

AWS扩展了GuardDuty在EKS集群的威胁检测能力,新增运行时监控功能,利用管理的eBPF代理检测容器级威胁,如凭证外泄和加密挖矿。这一更新简化了安全管理,降低了用户部署代理的复杂性,并通过分析系统级遥测数据提供更细粒度的运行时可见性,反映了云安全服务的深度集成趋势。

AWS通过GuardDuty推出EKS扩展威胁检测
原文英文,约500词,阅读约需2分钟。发表于:
阅读原文
原文中文,约2400字,阅读约需6分钟。发表于:
阅读原文

使用 FSx for NetApp ONTAP 实现 Amazon EKS 和 Windows 访问同一份数据

在本博客中,我们演示介绍了一种如何使用 FSx for NetApp ONTAP、NetApp ONTAP CLI、Trident 为 ONTAP 卷设置支持 EKS 与 Windows 对同一个卷的多协议访问的方法,为金融及其它行业云上容器化应用与 Windows 应用同时并发访问同一份数据的场景提供了解决方案。

在企业环境中,Linux与Windows工作负载需共享数据。Amazon FSx for NetApp ONTAP支持多协议访问,使得Linux和Windows能够通过各自协议访问同一数据。本文介绍如何利用FSx、NetApp ONTAP CLI和Trident实现EKS与Windows的多协议访问,适用于金融等行业的容器化应用。

使用 FSx for NetApp ONTAP 实现 Amazon EKS 和 Windows 访问同一份数据
原文中文,约8700字,阅读约需21分钟。发表于:
阅读原文

使用 AWS Transit Gateway 在 Amazon EKS 实现组播通信

客户以 EKS 为底座的容器化交易系统在云上部署时,遇到了 EKS 默认网络插件 VPC CNI 不支持组播的尴尬局面。为不影响现代化交易系统的云上部署,寻找基于 AWS 原生服务来支持 EKS 集群组播通信的方案已迫在眉睫。 本篇博客将介绍一个使用 AWS Transit Gateway 作为组播能力基座,通过增加额外 ENI 的方式为 EKS 集群提供组播通信能力的方案。

随着量化交易的发展,券商研发新交易系统以提升速度。组播通信因高效传输受到青睐,但EKS默认网络插件不支持组播。本文介绍了通过AWS Transit Gateway和额外ENI为EKS集群提供组播能力的方案,解决了云上交易系统的部署问题。

使用 AWS Transit Gateway 在 Amazon EKS 实现组播通信
原文中文,约8200字,阅读约需20分钟。发表于:
阅读原文

从分析到优化:Amazon Q CLI 助力 EKS 网络调用链剖析与运维实践

本文展示如何利用 Amazon Q CLI,通过自然语言交互方式分析从 ALB 到 Pod 的完整网络调用链。同时,提供常见网络问题的解决方案与优化实践。

本文探讨了AWS EKS环境中ALB到Pod的网络调用链,介绍了Amazon Q CLI作为分析工具,帮助运维人员理解复杂的网络路径。文章分析了网络架构、流量处理机制及常见问题,并提供优化策略,以提升EKS网络的稳定性和性能。

从分析到优化:Amazon Q CLI 助力 EKS 网络调用链剖析与运维实践
原文中文,约8400字,阅读约需20分钟。发表于:
阅读原文

AWS推出EKS仪表板以应对多云Kubernetes复杂性

Introducing the Amazon EKS Dashboard: a centralized management tool delivering unified visibility across multiple Kubernetes clusters in AWS. Simplifying operational oversight, it offers insights...

亚马逊网络服务推出了Amazon EKS仪表板,提供跨多个AWS区域和账户的Kubernetes集群统一管理界面,支持集群健康监测、成本预测和合规检查。用户可通过多种可视化格式查看和导出集群数据。该仪表板现已在us-east-1区域上线,EKS客户无需额外费用。

AWS推出EKS仪表板以应对多云Kubernetes复杂性
原文英文,约800词,阅读约需3分钟。发表于:
阅读原文

AWS推出开源模型上下文协议服务器,支持ECS、EKS和无服务器架构

AWS has launched open-source Model Context Protocol (MCP) servers on GitHub to supercharge AI development within Amazon ECS, EKS, and Serverless environments. These specialized tools equip...

AWS在GitHub上发布了开源的模型上下文协议(MCP)服务器,旨在提升AI开发助手的能力。这些服务器为Amazon ECS、EKS和无服务器架构提供实时上下文信息,帮助开发者更准确地构建和部署应用,减少常见错误。MCP服务器通过自然语言简化资源配置,提高开发效率,受到开发者社区的广泛关注。

AWS推出开源模型上下文协议服务器,支持ECS、EKS和无服务器架构
原文英文,约600词,阅读约需2分钟。发表于:
阅读原文