小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了五种主要的度量指标存储方案:Prometheus、Thanos、Mimir、VictoriaMetrics和M3DB。重点分析了Prometheus的架构、数据模型及扩展方案,讨论了各方案的优缺点及适用场景,尤其是在高并发和多租户环境下的表现,并提供了一些工程实践中的常见问题及解决方案,以帮助用户选择合适的监控工具。

【可观测性工程】Metrics:Prometheus、VictoriaMetrics、Thanos、Mimir、M3

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

网络可观测性结合基础设施与业务语义,传统监控关注链路层指标,而微服务时代需解决应用层问题。eBPF技术支持在内核中捕获网络事件,实现L3、L4、L7分层监控。文章介绍了Cilium Hubble、Tetragon、Pixie和DeepFlow等网络可观测工具,强调TLS解密、HTTP/2解析等工程难点,并提供大流量场景下的选型建议。

【可观测性工程】网络可观测性:Cilium Hubble、Pixie、DeepFlow、Tetragon

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

大模型系统的可观测性与传统微服务不同,需关注请求成本、延迟和正确性等多维度指标。文章提出四层观测模型:基础设施层、调用层、质量层和业务层,并推荐使用多种工具(如Langfuse、Helicone等)进行监控。可观测性应能快速定位问题并修复,以确保用户体验。

【大模型基础设施工程】23:LLM 可观测性

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
为什么你的AI代理在生产环境中失败,以及追踪如何提供帮助

生成式AI代理追踪是一种监测多步骤AI工作流的方法,能够捕捉决策路径和工具调用,帮助识别生产环境中的错误。传统监控工具难以应对代理系统的非确定性执行和认知失败,追踪提供了对代理行为的深入洞察,助力团队优化性能和解决问题。

为什么你的AI代理在生产环境中失败,以及追踪如何提供帮助

Redis Blog
Redis Blog · 2026-03-23T00:00:00Z
谁说 .NET 桌面过时了?AI 协作开发 WPF + SQLite 监控工具

本文介绍了一款轻量级本地监控工具,基于WPF开发,集成SQLite数据库,支持多种数据库连接和HTTP API调用。该项目强调简洁易用,用户可快速配置预警规则,实时监控数据库和API状态,确保隐私安全。

谁说 .NET 桌面过时了?AI 协作开发 WPF + SQLite 监控工具

dotNET跨平台
dotNET跨平台 · 2026-03-08T23:56:19Z
Netdata是一款非常出色的服务器监控工具

Netdata是一款强大的监控工具,支持Linux、macOS和Windows等多种平台,能够实时监测基础设施、应用程序和网络。它安装简单,提供丰富的仪表板信息,用户可以创建自定义空间以监控特定服务,如Docker容器,从而提升运维效率。

Netdata是一款非常出色的服务器监控工具

The New Stack
The New Stack · 2026-02-26T18:00:24Z

五角大楼向Anthropic发出最后通牒,要求其放弃AI限制条款,否则将被视为供应链风险,政府将强制接管其技术。Anthropic拒绝妥协,表示不愿成为监控工具。

派早报:五角大楼对 Anthropic 下达最后通牒、松下外包电视业务

少数派
少数派 · 2026-02-25T00:42:56Z
Jan Kristof Nidzwetzki:PostgreSQL自旋锁的eBPF追踪

PostgreSQL采用进程架构,每个连接由独立进程处理。自旋锁用于保护共享资源,减少上下文切换带来的延迟,并在竞争时自适应回退以降低CPU使用。本文介绍了自旋锁的实现及pg_spinlock_tracer监控工具的使用。

Jan Kristof Nidzwetzki:PostgreSQL自旋锁的eBPF追踪

Planet PostgreSQL
Planet PostgreSQL · 2026-02-08T00:00:00Z
使用免费的 Uptime Kuma 容器监控您的服务器

Uptime Kuma 是一款易用的监控工具,支持监控 Docker 容器、HTTP、MySQL 等服务。它依赖 Docker 安装,设置简单,用户友好,方便用户批量添加监控主机,避免逐个登录服务器。

使用免费的 Uptime Kuma 容器监控您的服务器

The New Stack
The New Stack · 2025-12-26T16:03:49Z

Zabbix Agent 是一款轻量级的监控工具,专为 Linux 系统设计,负责数据采集和上报。本文介绍了 Zabbix Agent 的安装、配置及监控实践,包括主动与被动模式的选择、常用监控项和最佳实践,旨在帮助用户构建高效的监控体系。

Zabbix Agent 在 Linux 上的深度实践:从安装到高级监控

极客技术博客’s Blog
极客技术博客’s Blog · 2025-12-09T10:00:08Z

本文介绍了Linux系统中查询系统信息的核心工具,如lscpu、free、df和top。这些工具组合使用,提供灵活的系统监控和故障排查能力,帮助用户深入理解Linux系统架构。

Linux 系统信息查询指南:从基础工具到高级实践

极客技术博客’s Blog
极客技术博客’s Blog · 2025-12-01T10:00:14Z

本文介绍了Linux性能监控的适用场景、前提条件及工具,强调在特定情况下不应仅依赖此方案。提供了性能瓶颈分析步骤,包括CPU、内存、磁盘和网络的排查方法,并列出常见瓶颈及优化措施。建议使用Prometheus和Grafana等监控工具进行系统监控。

Linux系统性能瓶颈分析:CPU、内存、磁盘、网络四维排查法

运维派
运维派 · 2025-11-18T08:45:31Z

本文介绍了Linux系统中的硬件监控,强调其在系统稳定性和性能优化中的重要性。内容涵盖监控工具、关键硬件指标及最佳实践,提供实时性能排查、磁盘空间预警脚本和自动化监控方案,帮助用户构建完整的硬件监控体系。

Linux 硬件监控完全指南:从基础工具到高级实践

极客技术博客’s Blog
极客技术博客’s Blog · 2025-11-17T10:00:11Z
使用Beszel监控跨服务器的Docker容器

Beszel是一款易于使用的监控工具,支持Docker部署,能够监控运行Docker容器的机器资源和健康状态。用户只需在多台支持Docker的机器上安装Beszel,即可通过单一仪表板快速访问资源使用情况。

使用Beszel监控跨服务器的Docker容器

The New Stack
The New Stack · 2025-11-07T22:00:49Z
Rider 2025.3新功能:监控工具窗口中的ASP.NET和数据库问题检测

Rider 2025.3的监控工具窗口增强了数据库和ASP.NET问题检测功能,实时跟踪慢查询和性能瓶颈,集中展示性能数据,帮助用户快速识别和解决问题,提高应用监控效率。

Rider 2025.3新功能:监控工具窗口中的ASP.NET和数据库问题检测

The JetBrains Blog
The JetBrains Blog · 2025-10-20T13:01:21Z
Vercel推出统一数据导出的Drains系统

Vercel推出Vercel Drains系统,能够将可观察性数据导出到外部服务,统一日志、分布式追踪、网页分析事件和性能指标,支持多种日志来源并自动丰富日志条目。用户可通过HTTP或集成排水口配置,简化与现有监控工具的连接,减少基础设施管理时间。

Vercel推出统一数据导出的Drains系统

InfoQ
InfoQ · 2025-10-04T16:35:00Z
报告称仅27%的组织具备全栈可观察性

根据New Relic报告,过去两年组织使用的可观察性工具减少了27%。调查显示,74%的受访者缺乏全栈可观察性,29%认为监控工具过多是主要挑战。缺乏全栈可观察性的组织每周经历高影响故障的可能性更高,52%的受访者计划在未来两年整合工具。

报告称仅27%的组织具备全栈可观察性

The New Stack
The New Stack · 2025-09-19T17:00:29Z

前端JavaScript性能测试指南强调测试的重要性,以确保流畅的用户体验。文章介绍了多种性能测量方法,如`performance.now()`和`console.time()`,以及使用Benchmark.js进行多次测试以获取可靠数据。Chrome DevTools和Sentry等工具可用于分析性能瓶颈和监控真实用户体验。最佳实践包括在真实环境中测试、结合实验室测试与真实用户监控、关注感知性能等。性能测试应视为一个持续的过程,以适应不断变化的用户需求。

前端JavaScript性能测试:全面指南

Sentry Blog
Sentry Blog · 2025-09-16T00:00:00Z
GPU从未准备好承担这个AI安全工作

随着AI的快速发展,GPU的安全性却未能跟上。由于GPU最初设计为单用户使用,缺乏多租户保护,导致在共享环境中处理AI工作负载时,企业面临数据泄露的风险。此外,GPU驱动复杂且权限高,缺乏有效监控工具,进一步增加了安全隐患。

GPU从未准备好承担这个AI安全工作

The New Stack
The New Stack · 2025-09-05T20:00:16Z
关于Heroku 6月10日服务中断的纠正措施更新

2025年6月10日,Heroku因供应商系统更新发生服务中断,状态网站也受到影响。6月15日,Heroku发布初步调查结果,承诺改善基础设施、沟通渠道和事故响应,实施控制措施,确保未来系统更改受控,并建立独立备份沟通渠道,优化监控工具,加快问题诊断和恢复,防止类似事件再次发生。

关于Heroku 6月10日服务中断的纠正措施更新

Heroku
Heroku · 2025-09-05T15:00:13Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码