小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从事件计数到服务级别指标:DigitalOcean如何重新思考可用性

本文讨论了DigitalOcean改进可用性测量的方法。通过将可用性分为控制平面和数据平面,并采用不同的服务级别指标(SLI),公司能够更准确地反映客户体验。新方法解决了旧指标的局限性,确保合理评估不同故障类型,并引入错误预算政策以指导工程优先级和产品开发。

从事件计数到服务级别指标:DigitalOcean如何重新思考可用性

The DigitalOcean Blog
The DigitalOcean Blog · 2026-04-23T09:15:00Z
增强Amazon EKS 节点自愈方案:基于 NPD 的故障持久化与安全修复探索

本文介绍了npd-node-replace组件的架构与实现,旨在自动化处理Kubernetes集群中的节点异常问题。该组件通过收集节点事件,提升集群的可用性与稳定性,支持多种节点形态,并提供可配置的容忍策略和通知机制,以便及时应对节点异常。

增强Amazon EKS 节点自愈方案:基于 NPD 的故障持久化与安全修复探索

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-04-10T07:07:32Z
GitHub可用性报告:2026年3月

2026年3月,GitHub发生四次服务性能下降事件,影响多个功能。问题源于用户设置的缓存机制写入负载,导致请求失败率高达93%。GitHub已采取措施改进监控和缓存机制,以提升服务稳定性。

GitHub可用性报告:2026年3月

The GitHub Blog
The GitHub Blog · 2026-04-09T02:21:17Z
Antony Pegg:pgEdge MCP服务器现已正式发布。这就是其重要性

pgEdge MCP服务器为Postgres提供安全和可用性,支持标准Postgres数据库。新版本增加自定义工具支持,简化数据库操作,适用于多种开发工具和模型,提供灵活的部署选项。

Antony Pegg:pgEdge MCP服务器现已正式发布。这就是其重要性

Planet PostgreSQL
Planet PostgreSQL · 2026-04-02T12:08:30Z

文章探讨了云服务的可用性(SLA)及其计算方式,指出实际故障往往是关联性的,导致冗余效果被高估。阿里云的案例显示,99.975%的可用性承诺在实际中难以兑现。强调快速恢复(MTTR)比追求更多的“9”更为重要,并提倡通过演练提高系统的真实可用性。

"高可用"的谎言:你的 99.99% 是怎么算出来的

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-03-15T00:00:00Z
GitHub 可用性报告:2026年2月

二月份,GitHub发生六起服务性能下降事件,主要由于数据库故障、配置更改和授权问题。为防止类似事件,GitHub已采取措施提升系统韧性,优化缓存机制,并增强监控和响应能力。

GitHub 可用性报告:2026年2月

The GitHub Blog
The GitHub Blog · 2026-03-12T03:23:54Z
应对GitHub近期的可用性问题

GitHub近期因用户激增导致服务中断,2月9日数据库过载影响用户管理。公司正在加速将基础设施迁移至Azure,以提升可用性和扩展性,并承诺保持透明沟通,确保平台稳定。

应对GitHub近期的可用性问题

The GitHub Blog
The GitHub Blog · 2026-03-11T21:41:51Z
从分钟到秒:Uber通过共识架构提升MySQL集群的可用性

Uber重新设计了MySQL基础设施,采用MySQL组复制(MGR)替代外部故障转移,故障恢复时间缩短至秒。新架构通过共识复制确保数据一致性,支持自动节点管理和负载均衡,提升系统的可靠性和可用性。

从分钟到秒:Uber通过共识架构提升MySQL集群的可用性

InfoQ
InfoQ · 2026-03-11T14:15:00Z
Elastic Cloud Serverless在微软Azure上的区域可用性翻倍

Elastic Cloud Serverless在微软Azure上扩展至八个地区,提供快速、安全的无基础设施管理解决方案,具备自动扩展、99.95%可用性和基于使用的定价模型,用户可轻松启动和扩展项目。

Elastic Cloud Serverless在微软Azure上的区域可用性翻倍

Elastic Blog - Elasticsearch, Kibana, and ELK Stack
Elastic Blog - Elasticsearch, Kibana, and ELK Stack · 2026-02-23T00:00:00Z
最终一致性:现代数据库背后的关键权衡

最终一致性是现代分布式系统的重要架构选择,它在性能、可扩展性和可用性之间进行权衡,使得能够构建服务数百万用户的系统。本文将探讨最终一致性的定义、原因、控制方法及其面临的挑战。

最终一致性:现代数据库背后的关键权衡

ByteByteGo Newsletter
ByteByteGo Newsletter · 2026-02-19T16:30:44Z
GitHub可用性报告:2026年1月

2026年1月,GitHub发生两次服务故障,导致性能下降。1月13日,因配置错误,Copilot服务中断,影响多个产品;1月15日,基础设施更新引发延迟和超时,主要影响未认证用户。团队正在加强监控和测试,以防止未来问题。

GitHub可用性报告:2026年1月

The GitHub Blog
The GitHub Blog · 2026-02-11T23:12:34Z
面向工作流的LLM应用提示工程

在LLM特性开发中,成功的关键在于有效的提示工程,而非模型本身。提示应具备一致性、可审计性和可用性,包含任务描述、示例和上下文。分离系统规则与用户输入,以确保输出结构化且可靠。使用Dify等工具可简化提示工程,提升工作流程的可靠性。

面向工作流的LLM应用提示工程

Dify AI
Dify AI · 2026-02-10T00:00:00Z
尝试使用 DeepSeek-OCR 2

DeepSeek-OCR 2于2026年发布,整体可用性下降。尽管在多行公式识别上有所进步,但简单公式的识别准确率降低,排版问题频发。相比V1版本,V2在实际应用中表现不佳,用户更倾向于使用V1进行校对。

尝试使用 DeepSeek-OCR 2

如鱼饮水
如鱼饮水 · 2026-02-04T07:25:29Z
Redis与ElastiCache:生产环境中“支持”的实际含义

在比较Redis与Amazon ElastiCache时,支持和责任归属非常重要。ElastiCache的服务水平协议侧重于基础设施的可用性,而Redis Cloud则提供更全面的支持,包括Redis的行为和数据一致性。Valkey的独立发展可能导致与Redis的兼容性问题,因此选择Redis支持是确保系统可靠性的关键。

Redis与ElastiCache:生产环境中“支持”的实际含义

Redis Blog
Redis Blog · 2026-01-22T00:00:00Z
99.9可用性!ACE Data Platform Google SERP API:3秒解锁全球搜索流量密码,SEO/跨境人必藏

ACE Data Cloud平台提供高效的内容分发解决方案,用户可通过浏览器插件自动将文章和视频发布到多个自媒体平台。该平台支持频道绑定、内容准备和发布任务管理,旨在实现低人工投入的持续推广,用户可手动或自动发布内容,并追踪发布状态与效果。

99.9可用性!ACE Data Platform Google SERP API:3秒解锁全球搜索流量密码,SEO/跨境人必藏

静觅
静觅 · 2026-01-18T14:02:16Z
宣布新模型及扩展可用性

Voyage AI推出Voyage 4系列模型,提供共享嵌入空间,支持跨模型兼容性,提升检索准确性并降低成本。新模型包括voyage-4-nano和voyage-multimodal-3.5,后者新增视频检索功能,现已在MongoDB Atlas和GCP上可用。

宣布新模型及扩展可用性

Voyage AI
Voyage AI · 2026-01-15T15:00:00Z
为什么 BGP 多宿主对始终在线的统一通信和 VoIP 至关重要

BGP多宿主技术可确保在ISP故障时,企业仍能访问语音和协作服务。通过与多个ISP连接,企业能够管理流量,提高IP地址的可靠性和冗余性,从而增强服务可用性和用户体验。

为什么 BGP 多宿主对始终在线的统一通信和 VoIP 至关重要

实时互动网
实时互动网 · 2026-01-15T02:11:38Z
GitHub 可用性报告:2025年12月

2025年12月,GitHub发生五次服务性能下降,原因包括配置错误、网络丢包和数据库迁移。团队已采取措施提升监控和响应能力,以减少未来事件的影响。

GitHub 可用性报告:2025年12月

The GitHub Blog
The GitHub Blog · 2026-01-14T22:06:49Z
凌晨三点的电话改变了我设计API的方式

在一次API故障后,我意识到设计需考虑故障情况。通过实施五项原则,我们将可用性从99.2%提升至99.95%。关键措施包括设计容错、强制幂等性、URL版本控制、提前限流和增强可观察性。这些改变显著减少了故障和客户投诉。

凌晨三点的电话改变了我设计API的方式

The New Stack
The New Stack · 2025-12-27T18:00:23Z
Google ADK 深度探索(二):不同语境下的专用上下文对象

ADK的上下文架构通过细分ReadonlyContext、CallbackContext、ToolContext和InvocationContext等上下文类型,提升了智能体的安全性和可用性。每种上下文遵循最小权限原则,确保组件在安全范围内执行,避免了早期框架的安全漏洞和认知过载。这种结构化设计使智能体能够安全、可观察地执行任务,推动了从原型到生产级系统的转变。

Google ADK 深度探索(二):不同语境下的专用上下文对象

乱世浮生
乱世浮生 · 2025-12-20T08:43:07Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码