集群技术与应用：从Kubernetes到AI代理的全面探索 - 小红花·文摘 - 小红花技术领袖俱乐部

1. 磁盘处理 1.1 查看磁盘查看新磁盘 1 fdisk -l Disk /dev/nvme1n1: 3.91 TiB, 4294967296000 bytes, 8388608000 sectors 1.2 组建 RAID0 如果有多块小盘，更好的方式是组建一个 RAID0，这样不仅能获得更大的存储目录，还能获得更快的速度。创建 RAID 1 mdadm --create...

如何添加 Huawei NPU 节点到 Kubernetes 集群

陈少文的博客 ·

华为韬定律干翻NVL72？五千芯片组网性能炸裂，AI集群不再看单颗算力

华为韬定律干翻NVL72？五千芯片组网性能炸裂，AI集群不再看单颗算力

极道 ·

商汤大装置联合近20家生态伙伴发起“银河计划”，将共建5个万卡级国产智算集群

量子位 ·

本文讨论了FoundationDB中Coordinators和Cluster Controller的角色与功能。Coordinators通过集群文件提供配置权威，持久化事务系统配置；而Cluster Controller负责角色招募和系统状态维护。Paxos协议用于确保配置一致性，但用户数据不存储在Coordinators上。文章强调了Coordinators与数据存储的区别及系统故障时的恢复机制。

【FoundationDB 内核】Coordinator 与集群配置：Paxos 边界、招募与恢复入口

土法炼钢兴趣小组的博客 ·

本文讨论了Milvus 2.6.x的架构，重点在于无状态Proxy和单活跃Coordinator的设计。Proxy负责请求校验和结果处理，Coordinator维护拓扑和任务调度。文章还提到时间戳管理和查询视图的路由，强调无状态Worker的优势与挑战，以及单活跃Coordinator在一致性和故障处理中的重要性。

【向量检索引擎】Proxy 与 Coordinator：接入面、TSO 与集群大脑

土法炼钢兴趣小组的博客 ·

中国首个十万卡集群落成！全国产算力支撑“十万卡时代”

量子位 ·

中国首个十万卡集群落成！全国产算力支撑“十万卡时代”

量子位 ·

在数百万个集群中运行Kubernetes教会了AWS关于区域故障的知识

在数百万个集群中运行Kubernetes教会了AWS关于区域故障的知识

The New Stack ·

像部署一样开发：缩小Kubernetes本地与集群之间的差距

像部署一样开发：缩小Kubernetes本地与集群之间的差距

The New Stack ·

技嘉科技发布AI TOP ATOM四机串联集群架构

技嘉科技发布AI TOP ATOM四机串联集群架构

全球TMT-美通国际 ·

肖恩·托马斯：期待Postgres 19：面向所有用户的数据校验和

肖恩·托马斯：期待Postgres 19：面向所有用户的数据校验和

Planet PostgreSQL ·

Etched集群规模内存CSM解析：铜缆如何解决AI芯片延迟死穴

Etched集群规模内存CSM解析：铜缆如何解决AI芯片延迟死穴

极道 ·

使用Kubernetes、Argo CD和GitOps构建集群感知的AI代理

使用Kubernetes、Argo CD和GitOps构建集群感知的AI代理

Cloud Native Computing Foundation ·

一个Postgres集群，多种应用

一个Postgres集群，多种应用

PlanetScale - Blog ·

750B MoE 模型从自建 RoCE 集群迁移至 AWS EFA：Prefill-Decode 分离推理的通信架构验证

750B MoE 模型从自建 RoCE 集群迁移至 AWS EFA：Prefill-Decode 分离推理的通信架构验证

亚马逊AWS官方博客 ·

如何构建小型语言模型集群的生产架构

如何构建小型语言模型集群的生产架构

freeCodeCamp.org ·

组复制与Percona XtraDB集群：一致性的真实成本

组复制与Percona XtraDB集群：一致性的真实成本

Percona Database Performance Blog ·

AI光子学瓶颈：AI集群可能先卡在光纤接口上

AI光子学瓶颈：AI集群可能先卡在光纤接口上

极道 ·

Floor Drees：如何在Kubernetes集群中测试PostgreSQL 19 Beta

Floor Drees：如何在Kubernetes集群中测试PostgreSQL 19 Beta

Planet PostgreSQL ·

从Crunchy Data PostgreSQL操作员迁移到Percona PostgreSQL操作员：备用集群方法

从Crunchy Data PostgreSQL操作员迁移到Percona PostgreSQL操作员：备用集群方法

Percona Database Performance Blog ·