小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI原生时代来临,商汤大装置如何重塑算力集群架构

商汤在AI原生时代重塑算力集群架构,推出AI算力池和虚拟集群技术,以提升资源利用率和扩缩容效率,推动国产推理基础设施升级,助力AI产业发展。

AI原生时代来临,商汤大装置如何重塑算力集群架构

量子位
量子位 · 2026-04-02T10:21:43Z
一天重写 JSONata,我用 400 美元干掉了公司 50 万美元的 K8s 集群

以色列工程师Nir Barak利用AI在一天内将JavaScript编写的JSONata重写为Go版本,节省每年50万美元的服务器成本,并实现1000倍的性能提升,展示了AI驱动重构的潜力。

一天重写 JSONata,我用 400 美元干掉了公司 50 万美元的 K8s 集群

Tony Bai
Tony Bai · 2026-04-01T00:29:37Z

一致性哈希是一种在分布式系统中有效处理节点动态增删时数据重新分配的技术,但其溢出概率高于预期。

一致性哈希中的溢出问题:为什么你的集群比你想象的更容易爆满

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-03-31T13:32:05Z
如何使用kcp在不增加开销的情况下运行多个Kubernetes集群

Kubernetes中的命名空间用于隔离工作负载,但随着需求增加,团队往往创建多个集群,导致管理复杂和成本上升。kcp允许在单一控制平面内运行多个逻辑集群,提供更好的多租户支持和资源管理,从而简化操作并降低成本。

如何使用kcp在不增加开销的情况下运行多个Kubernetes集群

freeCodeCamp.org
freeCodeCamp.org · 2026-03-27T20:36:42Z
如何保护Kubernetes集群:RBAC、Pod加固和运行时保护

安全应用部署中存在关键问题,如未设置CPU和内存限制、未定义ImagePullPolicy、缺少临时存储请求和限制、缺少网络策略及PodDisruptionBudget。这些问题可能导致资源滥用和应用崩溃,建议进行相应配置以提升稳定性和可用性。

如何保护Kubernetes集群:RBAC、Pod加固和运行时保护

freeCodeCamp.org
freeCodeCamp.org · 2026-03-25T16:45:23Z
Istio推出未来就绪的服务网,迎接AI时代,带来新的环境多集群、Gateway API推理扩展等功能

Istio在KubeCon + CloudNativeCon Europe 2026上推出了多集群支持和Gateway API推理扩展,旨在简化AI工作负载的管理,提高平台工程师和应用团队的效率。

Istio推出未来就绪的服务网,迎接AI时代,带来新的环境多集群、Gateway API推理扩展等功能

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-25T08:00:00Z
肖恩·托马斯:使用Patroni构建高可用性Postgres集群——第三部分:HAProxy

本文介绍了如何使用HAProxy作为路由层来构建高可用性Postgres集群,确保新连接指向主节点并提供健康检查功能。HAProxy的配置简单,完成后可通过测试验证其有效性,最终实现高效的Postgres集群解决方案。

肖恩·托马斯:使用Patroni构建高可用性Postgres集群——第三部分:HAProxy

Planet PostgreSQL
Planet PostgreSQL · 2026-03-20T06:47:06Z
如何在服务器集群发生故障时 WebRTC 架构仍能正常运行?

过去五年,AWS北弗吉尼亚集群多次发生互联网瘫痪。WebRTC平台通过负载均衡、数据库和媒体转发服务应对区域宕机。为提高可靠性,可在多个区域部署服务,并采用主备或双活数据库架构,确保系统稳健性。

如何在服务器集群发生故障时 WebRTC 架构仍能正常运行?

实时互动网
实时互动网 · 2026-03-19T03:24:01Z
扩展自主站点可靠性工程:90,000+服务器集群的架构、编排与验证

Cloudways通过AI SRE代理优化支持服务,减少了对人工支持的需求。AI代理提供快速故障排查,确保客户应用及时恢复。Cloudways Copilot结合监控、AI代理和验证机制,提高了服务效率,降低了人为错误。

扩展自主站点可靠性工程:90,000+服务器集群的架构、编排与验证

The DigitalOcean Blog
The DigitalOcean Blog · 2026-03-13T15:49:48Z
肖恩·托马斯:使用Patroni构建高可用Postgres集群——第二部分:Postgres与Patroni

本文介绍了如何使用Patroni构建高可用Postgres集群的第二部分,重点在于安装和配置Patroni。首先,设置PGDG仓库并安装Postgres和Patroni,然后使用pg_createconfig_patroni工具生成配置文件,并解释各部分功能。最后,启动Patroni并验证集群状态,确保其正常运行。

肖恩·托马斯:使用Patroni构建高可用Postgres集群——第二部分:Postgres与Patroni

Planet PostgreSQL
Planet PostgreSQL · 2026-03-13T06:12:14Z
从分钟到秒:Uber通过共识架构提升MySQL集群的可用性

Uber重新设计了MySQL基础设施,采用MySQL组复制(MGR)替代外部故障转移,故障恢复时间缩短至秒。新架构通过共识复制确保数据一致性,支持自动节点管理和负载均衡,提升系统的可靠性和可用性。

从分钟到秒:Uber通过共识架构提升MySQL集群的可用性

InfoQ
InfoQ · 2026-03-11T14:15:00Z
Netflix自动化RDS PostgreSQL到Aurora PostgreSQL的迁移,覆盖400个生产集群

Netflix开发了一种自动化平台,将Amazon RDS PostgreSQL数据库迁移至Amazon Aurora PostgreSQL,降低了运营风险和停机时间。该系统支持服务团队通过自助工作流发起迁移,并确保复制验证、切换控制和回滚保护,确保数据一致性和高效性。

Netflix自动化RDS PostgreSQL到Aurora PostgreSQL的迁移,覆盖400个生产集群

InfoQ
InfoQ · 2026-03-09T15:00:00Z
为什么当仪表板看起来正常时,你的Kubernetes集群还在添加节点?

Yasmin Rajabi是CloudBolt Software的首席运营官,因其在FinOps和Kubernetes社区的贡献而受到认可。她的工程、产品领导和运营背景使她对行业挑战有深入理解。

为什么当仪表板看起来正常时,你的Kubernetes集群还在添加节点?

The New Stack
The New Stack · 2026-03-08T15:10:06Z
Kubernetes的自我修复是如何工作的?通过破坏真实集群来理解自我修复

本文介绍了KubeLab,一个开源实验室,模拟七种故障以观察Kubernetes的自我修复能力。通过实际操作,用户将学习识别和处理生产环境中的故障模式。

Kubernetes的自我修复是如何工作的?通过破坏真实集群来理解自我修复

freeCodeCamp.org
freeCodeCamp.org · 2026-03-06T14:43:26Z
肖恩·托马斯:使用Patroni构建高可用Postgres集群——第一部分:etcd

本文介绍了如何构建Patroni集群,重点在于etcd的安装与配置。首先需创建三台Debian虚拟机并安装etcd,配置完成后验证集群状态,确保所有节点正常工作。三节点集群是实现高可用性的基础,后续将探讨Patroni的集成。

肖恩·托马斯:使用Patroni构建高可用Postgres集群——第一部分:etcd

Planet PostgreSQL
Planet PostgreSQL · 2026-03-06T07:48:55Z
谷歌提升GKE集群节点池自动创建速度

谷歌云优化了GKE的节点自动配置功能,显著缩短了Kubernetes集群新节点池的配置时间,提高了高并发计算的响应速度和节点创建效率,确保动态环境中的高可用性。这些改进使GKE在性能上更接近其他工具,适合多云策略的高性能计算需求。

谷歌提升GKE集群节点池自动创建速度

InfoQ
InfoQ · 2026-03-03T08:00:00Z
Cilium十周年:更强的加密、更安全的政策和更清晰的可见性以支持大规模集群

Cilium 1.19发布,庆祝十年发展,专注于安全加固和网络政策优化。新版本引入严格的加密模式,确保节点间流量加密,满足金融和公共部门需求。同时改进了多集群设置和可观察性,支持AI工作负载,增强安全性和可调试性。

Cilium十周年:更强的加密、更安全的政策和更清晰的可见性以支持大规模集群

InfoQ
InfoQ · 2026-02-25T23:00:00Z
构建Prometheus:后端聚合如何支持千兆瓦级AI集群

后端聚合(BAG)在Meta的Prometheus AI集群中至关重要,连接数千个GPU,支持1千兆瓦的容量。BAG通过分布式架构和模块化硬件,确保高性能和可靠性,满足未来需求,推动Meta全球网络的创新与扩展。

构建Prometheus:后端聚合如何支持千兆瓦级AI集群

Engineering at Meta
Engineering at Meta · 2026-02-09T17:00:33Z

本文分析了多机多盘 MinIO 集群在不同纠删码配置下的性能表现,探讨了这些配置对数据存储和访问速度的影响。

多机多盘 MinIO 集群在不同纠删码配置下的性能测试

陈少文的博客
陈少文的博客 · 2026-02-08T00:00:00Z
Kubernetes遥测功能完全危害集群

Kubernetes存在一个漏洞,允许具有读取权限的用户通过特定服务账户访问Kubelet,执行任意命令。安全研究员Graham Helton建议审查RBAC策略并实施网络政策以防止攻击。

Kubernetes遥测功能完全危害集群

The New Stack
The New Stack · 2026-01-28T18:30:42Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码