小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
DRA P3:DRA 工作流程与源码分析

DRA工作流程包括六个阶段:设备注册、分类定义、用户需求声明、调度器分配、设备准备与注入、Pod运行与清理。DRA Driver通过NVML扫描GPU并注册到Kubelet,用户创建Pod和ResourceClaim,调度器选择并分配设备。Kubelet负责准备设备并注入到容器,Pod终止后进行清理。DRA简化了设备管理流程,调度器负责分配决策。

DRA P3:DRA 工作流程与源码分析

探索云原生
探索云原生 · 2026-05-20T20:00:00Z
如何保护Kubernetes集群:角色基础访问控制、Pod加固与运行时保护

2018年,RedLock发现特斯拉的Kubernetes仪表板未加密,攻击者利用这一漏洞挖掘加密货币。Kubernetes的默认配置过于宽松,缺乏必要的安全控制。本文介绍了通过角色基础访问控制(RBAC)、Pod运行时安全和Falco检测引擎来增强Kubernetes集群的安全性,以确保其在生产环境中的安全。

如何保护Kubernetes集群:角色基础访问控制、Pod加固与运行时保护

freeCodeCamp.org
freeCodeCamp.org · 2026-03-25T16:45:23Z
kubernetes-goat学习笔记

在方法2中,如果可以访问pod,可以使用特定命令替代gitdump,以获取默认命名空间中的pod名称并进行解读。

kubernetes-goat学习笔记

像清水一般清澈透明
像清水一般清澈透明 · 2026-03-20T15:09:30Z
Kubernetes何时重启你的Pod——何时又不重启

本文探讨了Kubernetes中“容器重启”的不同含义,强调理解这些概念的重要性。提供了决策矩阵,帮助工程师判断何时重启Pod,并分析了ConfigMap、镜像更新和资源调整等场景的行为差异。作者指出,尽管容器重启具有破坏性,但能及时反映故障,而热重载可能导致潜在问题。

Kubernetes何时重启你的Pod——何时又不重启

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-17T11:00:00Z
技术速递|构建双 Sidecar Pod:在 Kubernetes 上将 GitHub Copilot SDK 与 Skill Server 相结合

本文探讨了如何利用Kubernetes的Sidecar模式构建云原生AI博客生成智能体,通过将GitHub Copilot SDK和技能管理部署为Sidecar容器,实现功能扩展和职责分离,提升系统可维护性和性能,适合AI应用场景,具备良好的安全性和可扩展性。

技术速递|构建双 Sidecar Pod:在 Kubernetes 上将 GitHub Copilot SDK 与 Skill Server 相结合

dotNET跨平台
dotNET跨平台 · 2026-03-05T23:56:19Z
Kubernetes推出节点就绪控制器以提高Pod调度可靠性

Kubernetes推出节点就绪控制器,以提高调度可靠性和集群健康。该功能解决了Pods被调度到不就绪节点的问题,减少了不必要的Pod驱逐。通过直接从kubelet获取节点就绪信号,确保API服务器状态反映最新健康信息,从而提升调度准确性,降低运营成本。

Kubernetes推出节点就绪控制器以提高Pod调度可靠性

InfoQ
InfoQ · 2026-02-27T12:00:00Z
Kubernetes教程(五十)---K8s 1.35:In-Place Pod Resize 正式 GA,实现 Pod 资源零中断调整

Kubernetes 1.35 引入了原地 Pod 资源调整功能,允许在不重建 Pod 的情况下动态调整 CPU 和内存资源,实现零中断。这一功能提升了工作负载效率,支持自动缩放,简化运维。内存调整通常需重启,而 CPU 调整可即时生效,现已稳定,适用于生产环境。

Kubernetes教程(五十)---K8s 1.35:In-Place Pod Resize 正式 GA,实现 Pod 资源零中断调整

探索云原生
探索云原生 · 2026-01-20T00:00:00Z

Kubernetes中的弹性伸缩分为水平弹性伸缩(HPA)和垂直弹性伸缩(VPA)。HPA根据资源使用情况自动调整Pod副本数,以确保系统稳定性和资源利用率。它通过监控指标计算所需副本数,并引入冷却机制以防止频繁波动。最佳实践包括设置资源请求、合理配置副本数和使用自定义指标。HPA通常与Cluster Autoscaler配合使用,以确保资源充足。

K8s HPA原理及最佳实践

安志合的学习博客
安志合的学习博客 · 2026-01-12T02:28:12Z
Kubernetes v1.35:就地重启 Pod 提升效率的新境界

Kubernetes 1.35 引入了“就地重启所有容器”功能,允许高效重置 Pod 状态,特别适合 AI/ML 工作负载。此功能避免了 Pod 的删除和重建,提升了系统灵活性和鲁棒性。启用 RestartAllContainersOnContainerExits 特性后,开发者可更专注于核心逻辑,简化故障处理。

Kubernetes v1.35:就地重启 Pod 提升效率的新境界

Kubernetes Blog
Kubernetes Blog · 2026-01-02T18:30:00Z
Kubernetes 1.35发布,新增In-Place Pod Resize功能及AI优化调度

云原生计算基金会发布Kubernetes 1.35版本“Timbernetes”,重点优化AI/ML工作负载。新增In-Place Pod Resize功能,支持在不重启容器的情况下调整资源。引入Gang Scheduling、PodGroup API和改进的HPA容忍度,简化证书管理。Ingress NGINX控制器将于2026年3月停止维护,建议迁移至Gateway API。

Kubernetes 1.35发布,新增In-Place Pod Resize功能及AI优化调度

InfoQ
InfoQ · 2025-12-31T10:00:00Z
Kubernetes 1.35:就地Pod调整大小功能正式稳定

Kubernetes 1.35正式推出“就地Pod调整大小”功能,允许在运行中的Pod内动态调整CPU和内存资源,提升资源利用率和灵活性。该功能支持无中断调整,适合延迟敏感的工作负载,增强了自动扩展能力。

Kubernetes 1.35:就地Pod调整大小功能正式稳定

Kubernetes Blog
Kubernetes Blog · 2025-12-19T18:30:00Z
k8s学习

Kubernetes(K8s)是一个开源平台,用于容器化应用的部署和管理。它通过控制平面和节点组成集群,支持高可用性和容错。Pod是K8s的基本单元,包含一个或多个容器。K8s提供自动调度、负载均衡和滚动更新等功能,适用于生产环境,并通过ConfigMap和Service实现配置管理和服务发现,增强了应用的灵活性和可维护性。

k8s学习

Sekyoro的博客小屋
Sekyoro的博客小屋 · 2025-12-07T04:15:54Z
一次 K8s 集群内网故障的排查记录

本文记录了Kubernetes集群中Pod间网络性能问题的排查过程,发现使用flannel VXLAN导致网络速度极慢。通过将flannel后端切换为host-gw,Pod间带宽从1-2 Mbit/s提升至10 Gbit/s,成功解决了下载超时的问题。文章总结了排查经验,并对比了K8s网络模式,强调了VXLAN在特定环境下的性能问题及host-gw的优势。

一次 K8s 集群内网故障的排查记录

QingHao's Blog
QingHao's Blog · 2025-12-06T17:48:20Z
使用kubectl重启Kubernetes中的pod指南

本文介绍了如何使用kubectl重启Kubernetes中的pod,常见场景包括配置更改、故障恢复和调试。重启方法有kubectl rollout restart、删除pod、缩放副本和更新环境变量。了解重启时机和监控pod状态对应用稳定性至关重要。

使用kubectl重启Kubernetes中的pod指南

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2025-12-01T12:00:00Z

K8s集群入侵排查需迅速响应,分为Pod和Node两类。Pod可通过kubectl exec和kubectl debug命令进行排查,Node则使用kubectl debug node进行调试。K8s Audit记录API请求,帮助识别攻击行为,如未授权访问和创建特权Pod等。

K8s集群入侵排查技巧

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2025-11-13T03:33:43Z
如何在AWS中创建Kubernetes集群及Pod安全组 [完整手册]

Amazon EKS的Pod安全组功能允许在Pod级别实现细粒度的网络安全控制。通过为每个Pod分配独立的安全组,用户可以更有效地管理网络访问,克服传统EKS中所有Pod共享同一安全组的局限性。该功能通过AWS VPC CNI插件和安全组策略实现,支持不同微服务的网络访问模式,增强了安全性和灵活性。

如何在AWS中创建Kubernetes集群及Pod安全组 [完整手册]

freeCodeCamp.org
freeCodeCamp.org · 2025-10-15T23:53:37Z
Kubernetes 中的服务发现与网络路由

Kubernetes 通过 Service、EndpointSlice、DNS、Ingress 和 NetworkPolicy 等机制,实现了 Pod 之间的通信和外部服务访问,支持多种服务类型和网络策略,增强了云原生应用的可用性与扩展性。

Kubernetes 中的服务发现与网络路由

云原生
云原生 · 2025-10-13T00:00:00Z
Kubernetes 中的工作负载管理

本文概述了Kubernetes工作负载管理的核心概念与控制器,强调Pod作为基本单元,介绍了Deployment、StatefulSet、Job等控制器的特性与应用场景,并探讨了生命周期管理与最佳实践,旨在帮助用户高效部署和维护集群应用。

Kubernetes 中的工作负载管理

云原生
云原生 · 2025-10-13T00:00:00Z
kubectl cp:在Kubernetes Pod之间复制文件

在Kubernetes上部署应用可能复杂,了解常见错误可避免问题。使用kubectl cp命令在本地与K8s容器间复制文件时,需注意命名空间、权限和符号链接等。掌握基本语法和案例可提高效率,减少故障。

kubectl cp:在Kubernetes Pod之间复制文件

The New Stack
The New Stack · 2025-09-27T19:00:19Z
Kubernetes v1.34:Pod级资源功能已进入Beta阶段

Kubernetes v1.34发布了Pod级资源功能,现已进入Beta阶段并默认启用。该功能允许在Pod级别定义CPU和内存资源,简化资源管理,促进容器间资源共享,避免性能瓶颈。Pod级资源优先于容器级资源,确保整体资源使用不超过设定限制。

Kubernetes v1.34:Pod级资源功能已进入Beta阶段

Kubernetes Blog
Kubernetes Blog · 2025-09-22T18:30:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码