小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

在特定条件下,反向代理导致93%的性能损耗,常规监控未能发现问题。通过OpenResty XRay分析,发现连接未复用是主要原因。启用keepalive后,性能提升至21,923 QPS。进一步分析显示,编译选项影响性能,恢复优化后性能稳定。此案例强调了动态追踪工具在复杂系统中的重要性。

从 9万 QPS 到 6千:一次压测暴露的 15 倍性能黑洞,我们如何用 OpenResty XRay 定位根因

OpenResty 官方博客
OpenResty 官方博客 · 2025-12-23T00:00:00Z
利用 CloudWatch AIOps 实现智能化根因分析与故障排查

在复杂的云环境中,运维团队面临挑战。CloudWatch AIOps 利用人工智能和机器学习技术,自动化根因分析,快速定位和解决问题,从而提高故障排查效率,减轻运维负担。

利用 CloudWatch AIOps 实现智能化根因分析与故障排查

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-09-29T01:50:50Z

Nginx worker 进程崩溃常因内存踩踏,定位困难。本文通过 OpenResty XRay 复盘案例,揭示二次开发破坏连接池管理导致的 Bug,并提供有效的诊断思路。

从崩溃到根因:OpenResty XRay 如何将 Nginx 内存踩踏问题分析得明明白白

OpenResty 官方博客
OpenResty 官方博客 · 2025-07-16T00:00:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

连Claude 3.5都败下阵来,大语言模型能否定位软件服务的故障根因?

机器之心
机器之心 · 2025-04-22T04:45:00Z

在开发中,llama_index库的RunGptLLM类因不当使用eval函数而出现安全漏洞,允许攻击者执行任意命令。该漏洞已在新版本中修复。应避免直接使用eval处理用户输入,建议使用安全库和严格验证。

llama_index的CVE-2024-4181漏洞根因分析

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2024-11-21T08:10:20Z
教科书级的根因推导——必做题

文章分析了A服务访问B服务时RT突然上升的原因,认为连接数的增加是根本原因。提出了验证方法,包括让客户建立新连接或模拟网络抖动,以观察RT变化对连接数的影响。

教科书级的根因推导——必做题

plantegg
plantegg · 2024-10-12T09:30:03Z
英特尔Intel 酷睿Core 13/14 代桌面处理器不稳定性问题根因已定位并提供可能是最终版本的解决方案

英特尔确认Core 13/14代桌面处理器因IA核心时钟树电路在高温高压下老化导致不稳定。为解决Vmin电压偏移问题,英特尔发布了0x125和0x129微码更新,并计划通过0x12B微码进一步缓解。性能测试显示更新对性能影响在正常范围内。英特尔正与合作伙伴合作推动BIOS更新,用户需从制造商网站获取最新版本。移动处理器和未来产品不受影响。

英特尔Intel 酷睿Core 13/14 代桌面处理器不稳定性问题根因已定位并提供可能是最终版本的解决方案

苍穹の下
苍穹の下 · 2024-09-26T07:53:49Z

本文讨论了质量保障和测试用例设计的两个面试题。质量保障应从根因出发,采用不同方法推动落地。测试用例设计应学习更高效的方法,而非等价类和边界值方法。理论知识和实践经验并无高低之分,二者结合才是更好的方法。

很有意思的两个测试面试题 - 老_张

老_张
老_张 · 2024-06-13T08:00:00Z

利用决策规则集处理不平衡数据,本文提出了一种新方法,旨在适应改变服务中不平衡故障情景,并提供易于理解和验证的可解释故障原因。与现有的故障定位算法相比,该算法在准确性和模型可解释性方面表现优异。

SLIM:用于微服务中不平衡数据的可扩展轻量级根因分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-31T00:00:00Z

本文讨论了软件测试中bug根因分析的重要性,强调了对需求的了解、研发测试流程和方法的掌握以及技术手段的灵活应用。bug根因分析是提升质量和效率的实用方式,步骤包括统计问题、开展根因分析、思考解决办法、找到适合团队的方案以及持续优化。与其他团队合作是必要的。

聊聊BUG的根因分析 - 老_张

老_张
老_张 · 2024-02-07T01:17:00Z

本文介绍了 TiDB 集群中业务 SQL 变慢的排查思路,包括常规排查和全链路排查。文章强调了定位问题根因所在的能力的重要性。

最佳实践:TiDB 业务写变慢分析处理

TiDB_PingCAP 的博客
TiDB_PingCAP 的博客 · 2023-09-20T13:35:59Z
扑朔迷离的根因分析

本文介绍了根因分析的原则和业务结构,以及监控数据的分析。通过对Tomcat和Database的RT监控数据的比较,发现高并发情况下Tomcat的RT上升,Database的RT下降。进一步分析发现,这是因为Tomcat在Database响应慢时拦截流量,导致Tomcat的RT上升。同时提到了Druid连接池的报错问题和分片逻辑的影响。总结了问题的根本原因和压测能过的原因。

扑朔迷离的根因分析

plantegg
plantegg · 2023-07-23T04:30:03Z
扑朔迷离的根因分析--抖动和并发

本文讲述了一个关于Tomcat和Database之间性能问题的案例,发现压力增加时Tomcat的QPS下降,Database的RT增加。问题出在Database端,由于MySQL等锁导致的RT抖动越来越多。绕过Tomcat直接压测Database时,QPS能上去,但通过Tomcat压测时却上不去。业务逻辑中每次请求发出多条SQL,其中一条SQL的RT较高会影响整个业务逻辑的RT。增加Tomcat节点不能解决问题。文章提到了事务不提交的代价和解决方法。

扑朔迷离的根因分析--抖动和并发

plantegg
plantegg · 2023-07-23T04:30:03Z

在618保障大促中,消失的异常堆栈可能会给我们带来麻烦。异常堆栈是解决线上问题的关键之一。Fast Throw是一种优化方式,可以提高性能。不能因为消失的异常堆栈就关闭fast throw优化。通过追溯相同的日志来定位问题。某台机器性能波动导致接口超时,导致NullPointerException。问题根源是代码兼容性不足。TCP重传数较高可能是由于网络抖动或连接性问题导致。需要找出问题的根因,推动团队优化和提升。

如何从消失的异常堆栈定位线上问题 | 京东云技术团队

京东科技开发者
京东科技开发者 · 2023-06-29T02:19:14Z

如何通过测试来管理开发遵守开发规范?团队协作要管理预期目标,保持信息同步。解决问题需要找到根因并提出可行方案。

测试流程规范如何推动落地? - 老_张

老_张
老_张 · 2023-03-30T06:23:00Z

服务发生性能恶化时,需要投入大量人力分析性能异常根因,分析成本高,耗时长。我们提出了一种先在异常调用链内部分析候选根因,再在全局拓扑环境下对候选根因进行汇聚的二级分析方法,克服了调用链之间异常相互影响导致根因难以确定的问题,快速识别和定位恶化接口的根因。

4种API性能恶化根因分析

华为云官方博客
华为云官方博客 · 2023-03-22T02:52:18Z
AI驱动的根因隔离如何降低风险

AI技术可以有效地帮助组织管理事件,预测未来趋势并自动采取积极的补救措施或提供最佳的预防风险管理措施。AI模型可以通过训练和学习日志指标数据的模式来预测基础架构系统的未来行为,并基于最近的历史事件预测可能的未来结果。AI系统可以自主地执行动态负载管理和节点隔离等操作,从而减少服务中断对特定根节点的影响。AI技术可以帮助组织快速识别和控制IT故障或事件,从而降低风险,最大限度地减少对业务运营的影响。

AI驱动的根因隔离如何降低风险

BMC Software | Blogs
BMC Software | Blogs · 2023-02-07T09:15:01Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码