小红花·文摘

本文讨论了FoundationDB的存储架构，重点在于客户端如何直接读取Storage Server，绕过Proxy和Resolver。每个Storage Server管理多个shard，支持异步复制。客户端通过缓存的元数据定位数据，并在5秒内读取版本。文章还探讨了数据迁移、负载均衡机制，以及读路径设计如何提高性能和一致性。

【FoundationDB 内核】Storage Server：Shard、版本读取与读路径

土法炼钢兴趣小组的博客 ·

PD（Placement Driver）作为TiKV的调度中心，通过心跳机制收集集群状态，生成调度建议（Operator），并发送给Region Leader。调度过程异步，Leader可选择执行或跳过建议。PD使用Store心跳提供宏观视图，Region心跳提供精确位置。调度的基本单元是Operator，主要目标是负载均衡和副本管理，决策受限于放置规则和调度限制，以确保系统稳定性。

【TiKV / HTAP 内核】PD 元数据与调度：心跳、算子与调度器

土法炼钢兴趣小组的博客 ·

bitdrift如何在Amazon CloudFront上为直播体育赛事扩展至1.21亿个并发gRPC连接

AWS Architecture Blog ·

大模型推理路由难题反而催生稀疏注意力？

极道 ·

服务端负载均衡（LB）和客户端LB的健康检查机制不同。服务端LB通过中心代理主动探测后端实例，而客户端LB由每个客户端独立探测。健康检查方式包括主动探测、客户端主动探测和被动检测，选择方式取决于系统规模、调用频率和运维能力。服务端LB适合大多数团队，客户端LB在高负载时更有效，两者可结合使用以优化性能。

TIL：服务端 vs 客户端负载均衡的健康检查机制

暗无天日 ·

大型平台如何处理每日数百万笔交易

freeCodeCamp.org ·

使用vLLM + Qwen3.5部署内网AI笔记

tlanyan ·

浏览器直接访问正常，过了负载均衡就崩了？只因响应头里多了个空格

iMaeGoo's Blog ·

多路径磁盘使用场景

安志合的学习博客 ·

Modular：为什么大语言模型推理需要一种新型路由器 - 第1部分

Modular Blog ·

在Google上设置静态页面CDN加速的步骤包括：创建公开访问的bucket并授予`allUsers` Storage Object Viewer权限；设置CDN并指向新创建的bucket；最后在负载均衡控制台获取公网IP进行DNS解析。

在 Google 设置静态页面 CDN 加速

了迹奇有没 ·

AWS Direct Connect 故障演练实战指南

亚马逊AWS官方博客 ·

2024年，混合专家（MoE）架构成为大模型的主流，开源项目如Mixtral和DeepSeek推动了其发展。MoE通过减少激活参数显著降低计算成本，同时提升模型表达能力，适合算力充裕的场景。关键技术包括细粒度专家、共享专家和改进的负载均衡策略。未来，MoE将向更大规模和动态专家数发展。

【大模型基础设施工程】08：MoE 训练工程

土法炼钢兴趣小组的博客 ·

学习软件系统设计

freeCodeCamp.org ·

大型语言模型服务的负载均衡与扩展

The DigitalOcean Blog ·

在电商平台大促前，运维团队将应用服务器从8台扩展到32台，但由于负载均衡器开启会话保持，导致流量分布不均，影响性能。文章探讨了无状态服务的重要性，强调将状态外置到共享存储，以实现更好的扩展性和故障隔离。无状态服务允许任意请求由任意实例处理，简化了发布和测试过程。通过将会话、缓存和文件状态外置，系统能够提高性能和可靠性，避免Sticky Session带来的问题。

【系统架构设计】无状态设计：扩展的第一步也是最难的一步

土法炼钢兴趣小组的博客 ·

微软希望让服务网格变得无形

The New Stack ·

混合专家架构在人工智能模型中的工作原理

freeCodeCamp.org ·

一致性哈希在分布式系统中常用，但其负载均衡效果不如Jump Hash、Rendezvous Hash和Maglev Hash。实验显示，使用150个虚拟节点的一致性哈希仍然不如其他算法。Jump Hash和Rendezvous Hash在节点数较少时表现优异，且实现简单。对于大规模系统，一致性哈希仅在特定条件下合理。

一致性哈希可能还不如随机

土法炼钢兴趣小组的博客 ·

FAST'26 论文导读 | 分组 I/O API 与透明读写优化 AI 作业快速云存储

Steins;Lab ·