小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AWS Direct Connect 故障演练实战指南

本文介绍了AWS Direct Connect故障演练的最佳实践,强调定期演练在负载均衡和主备场景中的重要性。通过CloudWatch监控、BGP故障测试和AWS Fault Injection Service,客户可以验证混合云连接的切换能力,确保在故障时业务的稳定性。建议将故障演练纳入运维计划,以提升高可用方案的可靠性。

AWS Direct Connect 故障演练实战指南

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-04-30T01:27:51Z

2024年,混合专家(MoE)架构成为大模型的主流,开源项目如Mixtral和DeepSeek推动了其发展。MoE通过减少激活参数显著降低计算成本,同时提升模型表达能力,适合算力充裕的场景。关键技术包括细粒度专家、共享专家和改进的负载均衡策略。未来,MoE将向更大规模和动态专家数发展。

【大模型基础设施工程】08:MoE 训练工程

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
学习软件系统设计

这篇文章介绍了freeCodeCamp.org YouTube频道发布的系统设计课程,内容涵盖从基础概念到生产级系统,包括数据库、扩展和负载均衡。学习者将掌握构建和保护API的实用技术,涉及RESTful和GraphQL。课程时长为2小时。

学习软件系统设计

freeCodeCamp.org
freeCodeCamp.org · 2026-04-16T13:19:19Z
大型语言模型服务的负载均衡与扩展

负载均衡在大型语言模型(LLM)中与传统服务不同,主要由于提示缓存的存在。提示缓存能显著降低输入成本和延迟,但需要优化请求路由。文章探讨了缓存感知路由策略,强调精确前缀缓存路由的优势,以提高吞吐量。使用外部源如Redis可以实现高可用性和独立扩展。未来方向是实现跨副本共享缓存,以提升效率。

大型语言模型服务的负载均衡与扩展

The DigitalOcean Blog
The DigitalOcean Blog · 2026-04-15T19:03:31Z

在电商平台大促前,运维团队将应用服务器从8台扩展到32台,但由于负载均衡器开启会话保持,导致流量分布不均,影响性能。文章探讨了无状态服务的重要性,强调将状态外置到共享存储,以实现更好的扩展性和故障隔离。无状态服务允许任意请求由任意实例处理,简化了发布和测试过程。通过将会话、缓存和文件状态外置,系统能够提高性能和可靠性,避免Sticky Session带来的问题。

【系统架构设计百科】无状态设计:扩展的第一步也是最难的一步

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z
微软希望让服务网格变得无形

在2026年KubeCon大会上,微软的Mitch Connors介绍了基于Istio的Azure Kubernetes Application Network,该服务网格旨在简化用户体验,满足客户对安全代理的需求。Connors指出,AI工作负载对网络层的要求不同,传统的HTTP路由不再适用。新产品支持多集群和GPU负载均衡,旨在吸引尚未采用服务网格的用户。

微软希望让服务网格变得无形

The New Stack
The New Stack · 2026-04-08T17:11:05Z
混合专家架构在人工智能模型中的工作原理

混合专家(MoE)架构通过将AI模型划分为多个专门子网络来优化性能,仅激活相关专家以减少计算需求。Mixtral模型展示了MoE在实际应用中的高效性,尽管存在负载均衡挑战,但通过“噪声top-k”技术可实现更均衡的专家激活。MoE架构在提升AI系统效率方面具有重要潜力。

混合专家架构在人工智能模型中的工作原理

freeCodeCamp.org
freeCodeCamp.org · 2026-04-07T17:18:05Z

一致性哈希在分布式系统中常用,但其负载均衡效果不如Jump Hash、Rendezvous Hash和Maglev Hash。实验显示,使用150个虚拟节点的一致性哈希仍然不如其他算法。Jump Hash和Rendezvous Hash在节点数较少时表现优异,且实现简单。对于大规模系统,一致性哈希仅在特定条件下合理。

一致性哈希可能还不如随机

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-03-31T00:00:00Z
FAST'26 论文导读 | 分组 I/O API 与透明读写优化 AI 作业快速云存储

本文探讨了AITURBO在AI任务中的分布式读写缓存优化,强调了闲置算力的利用、中间层的插入和显式HINT的价值,以及通用与专用存储的权衡。AITURBO通过简单API实现高效去重和负载均衡,提升了存储性能,适合大规模数据传输。

FAST'26 论文导读 | 分组 I/O API 与透明读写优化 AI 作业快速云存储

Steins;Lab
Steins;Lab · 2026-03-23T05:43:39Z
MetalLB才是给Ingress这个老登做负重前行的那个男人

本文讨论了在Kubernetes中部署ingress-nginx的重要性,强调负载均衡器的作用。NodePort和LoadBalancer是两种服务暴露方式,后者可通过MetalLB在自建集群中实现,解决裸金属集群的负载均衡问题。Ingress作为统一入口,整合多种服务访问规则。

MetalLB才是给Ingress这个老登做负重前行的那个男人

dotNET跨平台
dotNET跨平台 · 2026-03-19T23:26:00Z
如何在服务器集群发生故障时 WebRTC 架构仍能正常运行?

过去五年,AWS北弗吉尼亚集群多次发生互联网瘫痪。WebRTC平台通过负载均衡、数据库和媒体转发服务应对区域宕机。为提高可靠性,可在多个区域部署服务,并采用主备或双活数据库架构,确保系统稳健性。

如何在服务器集群发生故障时 WebRTC 架构仍能正常运行?

实时互动网
实时互动网 · 2026-03-19T03:24:01Z

NewLife.Core v11.12 更新了序列化、网络性能和配置系统,增强了多服务负载均衡、依赖注入和工具类功能,优化了文档和测试,提升了整体性能和稳定性。

NewLife核心组件2026年3月版发布

dotNET跨平台
dotNET跨平台 · 2026-03-02T00:02:23Z
Kubernetes WG Serving 在成功推进 AI 推理支持后宣布解散

Kubernetes WG Serving 组已解散,专注于支持Kubernetes上的AI推理工作。该组收集了模型服务器和硬件提供商的需求,推动了负载均衡和工作负载的演变。未解决的问题已转交给llm-d项目,继续推进推理需求。感谢所有参与者的贡献。

Kubernetes WG Serving 在成功推进 AI 推理支持后宣布解散

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-02-26T13:30:40Z
主动-主动架构:不同的系统配置如何解锁新的可靠性水平

主动-主动架构是一种系统配置,多个相同节点同时活跃并并行处理请求,以提高可靠性和可扩展性。若某节点故障,其他节点可继续提供服务,确保应用可用性。该架构适用于电商、金融和电信等高流量行业,具备冗余和负载均衡,优化资源利用和性能。

主动-主动架构:不同的系统配置如何解锁新的可靠性水平

Redis Blog
Redis Blog · 2026-02-18T00:00:00Z
杰里米·施奈德:阻塞锁故障如何从行级别升级为完全系统停机

文章讨论了PgBouncer在负载均衡器后连接池污染导致的故障模式,建议使用PgBouncer对等配置以防止此类问题。同时指出Go的数据库连接池存在缺陷,可能影响应用性能。测试结果表明,连接池污染会导致数据库连接耗尽,最终可能导致系统崩溃。

杰里米·施奈德:阻塞锁故障如何从行级别升级为完全系统停机

Planet PostgreSQL
Planet PostgreSQL · 2026-01-20T04:23:48Z
使用 Stalwart 自托管邮局服务

Stalwart是一款高性能的邮件与协作服务器,使用Rust编写,资源占用低,适合小型组织。配置简单,支持多节点负载均衡,并具备安全防护机制。尽管性能优秀,但官方文档逻辑混乱,用户体验较差。

使用 Stalwart 自托管邮局服务

Dejavu's Blog
Dejavu's Blog · 2026-01-17T00:12:41Z

在Google上设置静态页面CDN加速的步骤包括:创建公开访问的bucket并授予`allUsers` Storage Object Viewer权限;设置CDN并指向新创建的bucket;最后在负载均衡控制台获取公网IP进行DNS解析。

在 Google 设置静态页面 CDN 加速

了迹奇有没
了迹奇有没 · 2025-12-30T12:56:05Z
AWS推出ECS Express模式,简化容器化应用部署

AWS推出Amazon ECS Express模式,简化容器化应用和API的部署。用户只需提供容器镜像和IAM角色,系统会自动创建基础设施,包括HTTPS应用负载均衡器。该服务适合快速部署的开发者,支持自动扩展,用户可完全控制AWS资源。尽管不支持蓝绿部署,但社区反响积极,认为简化了TLS加密和负载均衡配置。

AWS推出ECS Express模式,简化容器化应用部署

InfoQ
InfoQ · 2025-12-21T09:00:00Z
如何通过Gemini和Cloud Run降低生成AI应用的延迟

本文介绍了如何构建全球AI架构,以实现低延迟和个性化的生成AI服务。通过利用Google基础设施,服务在美国、欧洲和亚洲多个地区部署,确保用户快速响应。该服务名为“本地向导”,根据用户位置提供个性化建议。文章详细描述了构建、部署和测试的步骤,并强调全球负载均衡的重要性。

如何通过Gemini和Cloud Run降低生成AI应用的延迟

freeCodeCamp.org
freeCodeCamp.org · 2025-12-10T14:35:12Z

透明代理是网络编程的基础项目,核心在于将客户端数据转发至服务器。设计中维护两个连接,利用bufferevent实现双向转发和流量控制,以防内存溢出。该项目为负载均衡器和SOCKS5代理奠定基础。

实战:透明代理 (Transparent Proxy)

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-11-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码