小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

分布式系统的核心在于在网络分区、时钟漂移和节点故障等情况下保持正确性。文章探讨了一致性、共识和复制等主题,并提供了69篇相关文献的统一入口,涵盖分布式系统的核心领域。

分布式系统百科

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

本文介绍了一个技术专题的总目录,涵盖大模型与AI工程、分布式系统、存储工程、网络工程、密码学、安全、操作系统和算法等多个领域的系列文章,提供详细的主题介绍和入口链接,方便读者深入学习。

全部系列索引

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
从零构建在线直播编辑分布式系统:架构设计与实现

本文介绍了设计高并发、可扩展的在线直播编辑系统的方法,涉及实时转码、截图、HLS切片和任务调度等技术挑战。系统采用Manager-Worker架构,使用Go语言和Consul进行服务发现,FFmpeg处理视频,MySQL作为数据库。实现了故障恢复、性能优化和监控机制,以确保高可用性和低延迟。

从零构建在线直播编辑分布式系统:架构设计与实现

实时互动网
实时互动网 · 2026-04-21T10:18:36Z

某电商平台在大促期间出现尾延迟问题,导致用户投诉。研究表明,尾延迟对用户体验的影响大于平均延迟。文章探讨了尾延迟的数学原理及优化策略,如对冲请求和绑定请求,以减少整体请求延迟。强调在大规模分布式系统中,管理尾延迟是提升用户满意度的关键。

【系统架构设计百科】延迟分析:从 P50 到 P999 的全链路追踪

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z

本文探讨了幂等性在分布式系统中的重要性,尤其是在支付场景中的应用。通过案例分析,强调了设计幂等性以防止重复扣款和数据不一致的必要性。文章介绍了幂等性的定义、HTTP方法的幂等性语义,以及Stripe等公司的幂等性实现策略,包括幂等键的设计和使用。最后,比较了不同的实现方案,并提出了在支付系统中保障幂等性的多层防护策略。

【系统架构设计百科】幂等性设计:分布式环境下的安全重试

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z

在分布式系统中,服务间的网络调用可能导致依赖关系和故障放大。重试机制设计不当可能引发重试风暴,导致系统崩溃。弹性设计模式如熔断器、舱壁、超时和指数退避等,旨在解决这些问题。合理组合这些模式能有效提升系统的稳定性和可靠性。

【系统架构设计百科】弹性设计模式:熔断器、舱壁与超时

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z

在分布式系统中,消息队列(MQ)通过异步通信解决服务间的强耦合、级联故障和性能瓶颈问题。MQ提供解耦、削峰和容错功能,但也增加了系统复杂性,如消息投递语义和顺序性保证等。Kafka、RabbitMQ和Pulsar是主流的消息队列,各有优缺点,适用于不同场景。选择MQ时需权衡业务需求与技术复杂性,以确保系统高效稳定。

【系统架构设计百科】消息队列架构:异步解耦的设计与陷阱

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z

随着云原生和分布式系统的发展,传统单体应用已无法满足企业需求。.NET微服务架构通过将应用拆分为小型自治服务,提升了业务解耦、弹性扩容和技术灵活性。微软提供了ASP.NET Core、Docker和Kubernetes等技术支持,帮助开发者高效构建和运维微服务。尽管存在分布式事务和运维成本等挑战,合理的架构设计和工具使用能够有效应对。掌握.NET微服务将成为开发者的重要竞争力。

.NET微服务架构:从理论到实战的全维度解析

dotNET跨平台
dotNET跨平台 · 2026-04-11T01:57:28Z

一致性哈希是一种用于分布式系统的技术,旨在减少节点变更时的键重新映射。经典哈希环方法存在内存开销大和查找性能差的问题。Google 提出的 Jump Hash 和 Maglev Hash 提供了更优解决方案,前者实现简单且内存开销为零,后者支持动态节点增删且查找速度快。选择合适的哈希算法需根据具体场景,Jump Hash 适合节点增加,Maglev Hash 则适合频繁变更的环境。

一致性哈希:不要相信教科书版本

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-09T00:00:00Z
在您的组织中,可观察性仍然是一个运维问题吗?

本文探讨了如何将运行时遥测直接交给开发人员,以提升调试效率和软件可靠性。现代分布式和AI系统生成大量数据,开发者需在关键时刻有效利用这些数据。

在您的组织中,可观察性仍然是一个运维问题吗?

The New Stack
The New Stack · 2026-04-06T16:05:31Z
加一人物系列:让-巴蒂斯特·奥诺弗雷

让-巴蒂斯特·奥诺弗雷(JB)是Apache软件基金会的董事会成员,专注于大数据和分布式系统的架构挑战。他认为AI的崛起为开源带来了机遇,但也面临低质量贡献的挑战。他强调社区优先于代码,并建议新贡献者寻找合适的项目和导师。

加一人物系列:让-巴蒂斯特·奥诺弗雷

The Apache Software Foundation Blog
The Apache Software Foundation Blog · 2026-03-31T19:46:16Z

一致性哈希是一种在分布式系统中处理节点动态增删时数据分配的技术,但其溢出概率高于预期。例如,5个服务器每个容量为4时,存储10个数据项的溢出概率为16.37%。这表明传统容量规划未考虑数据随机分布和极端情况,可能增加服务器溢出风险。因此,设计系统时应考虑这些因素以降低溢出概率。

一致性哈希中的溢出问题:为什么你的集群比你想象的更容易爆满

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-03-31T13:32:05Z

一致性哈希在分布式系统中常用,但其负载均衡效果不如Jump Hash、Rendezvous Hash和Maglev Hash。实验显示,使用150个虚拟节点的一致性哈希仍然不如其他算法。Jump Hash和Rendezvous Hash在节点数较少时表现优异,且实现简单。对于大规模系统,一致性哈希仅在特定条件下合理。

一致性哈希可能还不如随机

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-03-31T00:00:00Z
第六章:分区

本文讨论了分布式系统中的数据存储扩展策略,比较了垂直扩展和水平扩展的优缺点。垂直扩展简单但存在单点故障风险,而水平扩展通过数据分区提高可用性。范围分区适合顺序查询但可能导致数据倾斜,哈希分区则均衡负载但牺牲顺序查询能力。文章还探讨了数据迁移和请求路由机制,强调在动态环境中保持数据一致性的重要性。

第六章:分区

codedump的网络日志
codedump的网络日志 · 2026-03-29T00:00:00Z
多云挑战、智能负载均衡与人工智能驱动的工作流:Databricks在SRECon 2026的分享

Dicer是Databricks开源的自动分片系统,旨在解决分布式系统中的效率和脆弱性问题。它动态管理分片,提高服务的可用性。Databricks在SRECon活动中深入探讨了Dicer及其在多云操作中的应用。

多云挑战、智能负载均衡与人工智能驱动的工作流:Databricks在SRECon 2026的分享

Databricks
Databricks · 2026-03-20T19:26:00Z
如果服务器悄悄“猝死”,你的系统还能活几秒?揭秘分布式集群的“续命”保底机制

分布式系统中的心跳机制通过定期发送心跳信号来确认节点状态,防止因节点失效导致系统崩溃。心跳频率与超时设置需平衡,以快速发现故障而不引发误报。高级系统如Cassandra和Gossip协议利用概率和去中心化方法提高故障检测准确性,防止脑裂现象,确保数据一致性。

如果服务器悄悄“猝死”,你的系统还能活几秒?揭秘分布式集群的“续命”保底机制

Tony Bai
Tony Bai · 2026-03-20T00:25:21Z
第四章:复制

数据复制是分布式系统的核心,主从复制模式中主节点负责写入,节点间需选举以避免脑裂。根据CAP定理,一致性、可用性和分区容错性无法同时满足。最终一致性允许短期不一致,强调未来的一致性。

第四章:复制

codedump的网络日志
codedump的网络日志 · 2026-03-12T00:00:00Z

系统设计不仅是面试准备,更是构建大规模系统的关键。文章介绍了10个GitHub资源,涵盖系统设计基础、面试准备和分布式系统,帮助工程师掌握可靠系统设计的结构化思维。

掌握系统设计的10个GitHub资源

KDnuggets
KDnuggets · 2026-03-05T13:00:50Z
第三章:分布式系统中的时间和顺序

在分布式系统中,多个节点的协作使事件顺序影响系统状态。由于物理时间无法准确判断事件顺序,引入了逻辑时钟,包括Lamport时钟和向量时钟。Lamport时钟满足基本条件但缺乏因果信息,而向量时钟能识别并发事件但开销较大。Chandy-Lamport算法用于获取一致的全局快照,强调因果关系的重要性超过物理时间。

第三章:分布式系统中的时间和顺序

codedump的网络日志
codedump的网络日志 · 2026-03-03T00:00:00Z
分布式系统控制面: 意大利面条与声明式有限状态机 (FSM)

本文讨论了分布式系统中节点状态管理的重要性,强调使用有限状态机(FSM)来避免复杂的状态组合和潜在错误。通过案例分析,指出传统的基于标志的管理方式容易导致逻辑混乱。提出使用状态转换表清晰定义合法状态及其转换,以确保系统在不同操作下的稳定性和可预测性,从而提高系统的健壮性和可维护性。

分布式系统控制面: 意大利面条与声明式有限状态机 (FSM)

Steins;Lab
Steins;Lab · 2026-02-28T14:30:15Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码