小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

数据库高可用性设计至关重要。文章分析了两个电商平台的故障案例,强调高可用架构需考虑故障检测、仲裁机制和数据一致性。高可用性不仅依赖冗余部署,还需有效的故障检测和切换机制,以将停机时间控制在可承受范围内,减少经济损失和用户信任下降。文章探讨了不同冗余模型、故障检测方法及数据一致性保障,强调高可用设计的复杂性与重要性。

【系统架构设计百科】高可用设计模式:冗余、故障转移与仲裁

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z
如果服务器悄悄“猝死”,你的系统还能活几秒?揭秘分布式集群的“续命”保底机制

分布式系统中的心跳机制通过定期发送心跳信号来确认节点状态,防止因节点失效导致系统崩溃。心跳频率与超时设置需平衡,以快速发现故障而不引发误报。高级系统如Cassandra和Gossip协议利用概率和去中心化方法提高故障检测准确性,防止脑裂现象,确保数据一致性。

如果服务器悄悄“猝死”,你的系统还能活几秒?揭秘分布式集群的“续命”保底机制

Tony Bai
Tony Bai · 2026-03-20T00:25:21Z

Microsoft Orleans通过集群架构和容灾机制,实现可伸缩性和容错性。Orleans集群由多个Silo组成,具备弹性扩展、高可用性和负载均衡。故障检测采用心跳机制,Grain可自动恢复,确保业务连续性。

构建高可用Orleans应用:集群配置与容灾机制详解

dotNET跨平台
dotNET跨平台 · 2025-12-15T23:50:43Z

高可用集群(HA Cluster)是基于Pacemaker和Corosync技术的Linux集群实现,确保服务持续运行,避免单点故障,提升系统可靠性。构建时需遵循冗余设计、严格测试和监控告警原则。

Linux集群的最常见实现方法:高可用集群(Pacemaker/Corosync)全解析

极客技术博客’s Blog
极客技术博客’s Blog · 2025-12-02T10:08:12Z
部署安全:减少变更对客户的影响

2023年,Slack启动了安全计划,目标是到2025年将客户影响时间减少90%。分析显示73%的客户事件源于Slack的变更,团队通过自动化和手动改进提升了故障检测与恢复速度。项目的成功与否不影响整体进步,持续学习和调整策略至关重要。未来将继续投资于自动化和一致性,以增强客户信任。

部署安全:减少变更对客户的影响

Slack Engineering
Slack Engineering · 2025-10-07T16:33:12Z

本研究提出了一种新方法——在线孤立森林(Online-iForest),专为流数据环境设计,能够实时跟踪数据生成,适用于网络安全、欺诈和故障检测等异常识别场景。

在线孤立森林

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

本研究提出了一种结合主成分分析与蚂蚱优化算法的深度神经网络优化方法,显著提高无线传感网络故障检测效率,分类准确率达到99.72%。

Efficient Fault Detection Based on PCA-Optimized Deep Neural Network Slicing and GOA Training

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-11T00:00:00Z

本研究提出了一种新方法——质量驱动最优传输(MROT),用于机器学习中的异常检测。实验结果表明,该算法在基准测试和故障检测方面优于传统方法。

Unsupervised Anomaly Detection via Quality-Driven Optimal Transport

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z
使用Fluent Bit和WebAssembly处理日志数据

Fluent Bit通过WebAssembly(WASM)插件扩展数据处理能力,支持用户自定义逻辑,提升日志数据的实时丰富和故障检测效率,适合复杂企业环境。

使用Fluent Bit和WebAssembly处理日志数据

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2025-01-28T16:00:00Z

AutoRestTest是一种新工具,结合了语义操作依赖图、多智能体强化学习和大型语言模型,旨在提高REST API测试的代码覆盖率和故障检测能力。初步结果显示,该工具在测试效率和故障检测方面具有显著提升潜力。

AutoRestTest: An Automated REST API Testing Tool Utilizing Large Language Models and Multi-Agent Reinforcement Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-15T00:00:00Z

本研究开发了交互式工具FaultExplainer,旨在解决化工过程故障检测的可解释性问题。该工具结合实时数据可视化和主成分分析,利用大型语言模型提升故障解释能力。实验结果表明,其在生成可行解释方面表现优异,但也存在一些局限性。

FaultExplainer: Achieving Interpretable Fault Detection and Diagnosis Using Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本研究提出了CableMon机器学习系统,通过主动网络维护数据有效检测和定位电缆宽带网络故障,显著提高了故障检测的有效性并降低了误报率。

Improving the Reliability of Cable Broadband Networks through Proactive Network Maintenance

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

该研究提出了一种名为“代码监控”(CaM)的方法,旨在解决闭环机器人系统中开放集故障的自动检测与预防问题。通过视觉-语言模型,将反应式和主动式故障检测统一为时空约束满足问题,实现实时监控。实验结果显示,CaM在干扰下的成功率提高了28.7%,执行时间减少了31.8%,并支持动态环境中的长时间任务。

Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z
支付渠道自动化监控与消息通知系统

构建一个自动化支付渠道监控系统,以应对第三方渠道故障。系统具备多渠道监控、快速故障检测和自动切换功能,采用基于Redis的时间序列数据库,设计包括交易路由、监控数据处理和可视化。未来计划优化算法,实现99%以上的警报准确率和自动故障恢复。

支付渠道自动化监控与消息通知系统

DEV Community
DEV Community · 2024-11-25T00:20:12Z

本研究利用机器学习技术开发了多种模型,以提高粒子加速器和光子学领域的性能,包括自由电子激光束定位、粒子方向恢复和故障检测。通过新数据集和先进算法,显著提升了预测准确性和效率,推动了相关技术的发展。

利用机器学习实现自由电子激光脉冲功率的一次性测量

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本文介绍了多种基于深度学习的故障检测方法,包括长短时记忆网络、卷积神经网络和Transformer模型。这些方法在机械故障分析、事故预测和噪声环境下的故障诊断中表现出高准确性,推动了智能维护技术的发展。

基于ETCN-SSA组合算法的核电站智能故障诊断方法研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-11T00:00:00Z

本研究提出了一种基于云-边协作的铁路道岔机故障实时监测与容错诊断系统,采用模块化故障诊断模型和云边管道并行框架,实现了97.4%的故障检测准确率。

Real-time and Downtime-tolerant Fault Diagnosis for Railway Turnout Machines: A Cloud-Edge Pipeline Parallelism Based Solution

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究提出了一种典型性意识学习(TAL)方法,以解决深度神经网络在故障检测中的过于自信问题。TAL通过动态调整样本的典型性指标,降低不典型样本的过拟合,从而显著提升了CIFAR100数据集上的故障检测性能,AURC提升超过5%。

典型性意识学习用于故障检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本研究提出了Minder工具,用于大规模分布式模型训练中的故障机器检测。Minder能够高效识别故障特征,平均反应时间为3.6秒,准确率达到90.4%,显示出良好的应用潜力。

Minder: Faulty Machine Detection in Large-scale Distributed Model Training

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-04T00:00:00Z

本文介绍了一种基于深度学习的故障检测方法,利用高精度数据采集和长短时记忆网络进行故障预测。研究表明,该方法在电力系统中有效预测电压失控事件,并展示了其优越性和广泛适用性。

基于预训练和微调的注意力驱动神经算子的故障后电压轨迹的符合预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码