小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

监控与可观测性是不同的概念,监控关注预设问题和指标,而可观测性能够回答任意问题。传统的监控工具如Nagios和Zabbix逐渐被Prometheus和OpenTelemetry取代,后者支持更灵活的数据模型和多维度分析。可观测性强调记录足够的上下文信息,以便在故障发生时进行深入分析。随着微服务和复杂系统的普及,传统监控已无法满足需求,行业正向统一的可观测性平台发展。

【可观测性工程】可观测性 vs 监控:从 Zabbix/Nagios 到 OpenTelemetry 的二十年

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

本文介绍了五种主要的度量指标存储方案:Prometheus、Thanos、Mimir、VictoriaMetrics和M3DB。重点分析了Prometheus的架构、数据模型及扩展方案,讨论了各方案的优缺点及适用场景,尤其是在高并发和多租户环境下的表现,并提供了一些工程实践中的常见问题及解决方案,以帮助用户选择合适的监控工具。

【可观测性工程】Metrics:Prometheus、VictoriaMetrics、Thanos、Mimir、M3

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
从定制到开放:使用Prometheus实现可扩展的网络探测和HTTP/3准备

Slack在HTTP/3支持中遇到客户端可观察性不足的问题。实习生Sebastian Feliciano为Prometheus Blackbox Exporter实现了QUIC支持,解决了监测HTTP/3端点的难题。这一开源贡献提升了监测能力,并为Prometheus社区带来了益处,未来将继续改进。

从定制到开放:使用Prometheus实现可扩展的网络探测和HTTP/3准备

Slack Engineering
Slack Engineering · 2026-03-31T17:00:39Z
KubeCon + CloudNativeCon 欧洲 2026 联合活动深入探讨:观察日

观察日已成为云原生观察性社区的重要活动,汇聚了Prometheus、Fluentd等项目的维护者与实践者,涵盖AI系统、成本效率等新领域,提供多样化课程,促进项目间合作与交流。

KubeCon + CloudNativeCon 欧洲 2026 联合活动深入探讨:观察日

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-13T11:00:00Z
可观察性平台迁移指南:Prometheus、OpenTelemetry 和 Fluent Bit

本文讨论了观察平台迁移的最佳实践,强调使用开放标准工具(如Prometheus和OpenTelemetry)以简化迁移过程。迁移前需记录关键数据,明确需求,逐步引入新平台,确保可见性。通过双重运行验证新系统的有效性,最终将流量转移至新平台,确保团队顺利过渡。

可观察性平台迁移指南:Prometheus、OpenTelemetry 和 Fluent Bit

The New Stack
The New Stack · 2026-02-26T15:28:43Z
OpenTelemetry路线图:未来的采样率和收集器改进

OpenTelemetry已成为许多组织的标准,旨在统一应用程序的遥测数据。在布鲁塞尔举行的OTel Unplugged EU会议上,讨论了OpenTelemetry的未来和路线图,包括增强采样算法和简化微服务的可观察性。项目提出了“实体”概念以定义资源身份,并计划稳定核心收集器。同时,与Prometheus的集成也有显著改善,支持UTF-8等新特性。

OpenTelemetry路线图:未来的采样率和收集器改进

The New Stack
The New Stack · 2026-02-24T19:00:44Z
Prometheus与OpenTelemetry终于和谐共处

Prometheus与OpenTelemetry之间的技术不兼容争议已解决。Prometheus仍是Kubernetes度量的标准,而OpenTelemetry则补充了分布式追踪和日志。两者的集成显著改善,Prometheus 3.0支持UTF-8,简化了开发者工作,促进了合作,减少了复杂性。

Prometheus与OpenTelemetry终于和谐共处

The New Stack
The New Stack · 2026-02-19T18:00:24Z
构建Prometheus:后端聚合如何支持千兆瓦级AI集群

后端聚合(BAG)在Meta的Prometheus AI集群中至关重要,连接数千个GPU,支持1千兆瓦的容量。BAG通过分布式架构和模块化硬件,确保高性能和可靠性,满足未来需求,推动Meta全球网络的创新与扩展。

构建Prometheus:后端聚合如何支持千兆瓦级AI集群

Engineering at Meta
Engineering at Meta · 2026-02-09T17:00:33Z
安全、渐进式开源可观察性迁移指南

软件迁移不再漫长,借助开源工具可在数周内完成。许多组织采用开放标准架构,数据通过Prometheus和OpenTelemetry等工具流动。迁移步骤包括优先处理重要仪表板和警报,逐步引入新后端,并验证新系统的有效性。最终目标是实现可控、低成本的观察能力,避免未来的锁定和高昂费用。

安全、渐进式开源可观察性迁移指南

The New Stack
The New Stack · 2025-12-24T15:00:37Z
What Projects I Follow Updated This Week - 20251205

每周五更新重要版本信息,不记录bug修复,涵盖Docker、Jellyfin、Prometheus等项目的最新版本链接。

What Projects I Follow Updated This Week - 20251205

bboysoul的博客
bboysoul的博客 · 2025-12-05T09:46:00Z
高效管理容器化应用:弹性 Linux 虚拟机工具的最佳选择 | 开源日报 No.807

Alertmanager 是 Prometheus 的告警管理工具,支持告警去重、分组、路由和灵活的通知配置,具备静默和抑制功能,避免重复通知,提升告警处理效率。

高效管理容器化应用:弹性 Linux 虚拟机工具的最佳选择 | 开源日报 No.807

开源服务指南
开源服务指南 · 2025-12-02T07:35:26Z

监控系统是运维的重要工具,主流开源系统包括Zabbix和Prometheus。Prometheus由前Google员工开发,适合新手和进阶者,文档涵盖安装、启动、查询和可视化,提供实战项目和学习资源。

【监控】监控系统看这一篇就够了!Zabbix、Prometheus等常见监控教程

运维派
运维派 · 2025-11-22T18:01:57Z
杰夫·贝索斯将担任人工智能初创公司Project Prometheus的联合首席执行官

杰夫·贝索斯将担任人工智能初创公司Project Prometheus的联合首席执行官,该公司专注于利用AI改善计算机、汽车和航天制造。该项目已获得62亿美元投资,贝索斯将与联合创始人维克·巴贾杰共同管理,现有近100名员工,包括来自OpenAI和DeepMind的前员工。

杰夫·贝索斯将担任人工智能初创公司Project Prometheus的联合首席执行官

The Verge
The Verge · 2025-11-17T10:14:03Z

Grafana和Prometheus是DevOps领域的重要工具,用于监控和可视化数据,提升系统性能与可靠性。

Grafana + Prometheus

blogs.perl.org
blogs.perl.org · 2025-11-16T00:41:45Z
CNCF大使对云原生计算基金会十年发展的反思

CNCF成立十年,推动云原生应用的标准化,Prometheus等项目已成为监控领域的标准。目前CNCF拥有200多个项目,涵盖DevOps、FinOps等,社区合作与创新不断增强。作为CNCF大使,作者见证了这一成长历程。

CNCF大使对云原生计算基金会十年发展的反思

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2025-11-06T15:00:00Z
修复Prometheus与OpenTelemetry集成所需的问题

OpenTelemetry与Prometheus之间存在兼容性问题,主要由于OpenTelemetry缺乏服务发现和主动拉取功能。Prometheus专注于指标监控,而OpenTelemetry生成多种信号并传递给第三方系统。两者的集成需要在性能和语义约定方面改进,未来可能通过合成上报指标来解决健康检查问题。

修复Prometheus与OpenTelemetry集成所需的问题

The New Stack
The New Stack · 2025-11-05T00:00:59Z
Grafana Cloud中的Prometheus原生直方图:从您的Grafana可视化中获得更高精度

Grafana Cloud中,Prometheus原生直方图已稳定发布,提供更高精度和易用性。与传统直方图相比,原生直方图动态调整桶,降低运营成本。新功能包括与Grafana Metrics Drilldown的集成,用户可快速可视化数据。未来将推出自定义桶功能,进一步提升用户体验。

Grafana Cloud中的Prometheus原生直方图:从您的Grafana可视化中获得更高精度

engineering on Grafana Labs
engineering on Grafana Labs · 2025-10-30T00:00:00Z
OpenTelemetry 采用更新:Rust、Prometheus 及其他障碍

OpenTelemetry作为开源观察性项目,逐渐成为许多组织的标准选择,尽管仍在完善中。Rust语言的支持处于测试阶段,面临语义一致性和Prometheus兼容性等挑战,集成进展缓慢,主要受限于现有工具。

OpenTelemetry 采用更新:Rust、Prometheus 及其他障碍

The New Stack
The New Stack · 2025-10-26T18:00:55Z
监控系统

监控系统是Kubernetes可观测性的基础,通过Prometheus和Metrics Server等组件实时监控集群和应用状态,确保其稳定运行。合理设计指标和优化性能是保障集群稳定的关键。

监控系统

云原生
云原生 · 2025-10-18T16:00:00Z
Flipkart通过层次化联合设计将Prometheus扩展至8000万指标

Flipkart通过采用Prometheus的层次化联合设计,解决了监控可扩展性问题。最初使用StatsD聚合指标,但无法扩展。转向Prometheus后,通过本地服务器收集指标并通过/federate端点聚合,显著降低了指标基数和中央服务器负载。尽管在调试实例异常时效果有限,但该方法为应对云原生环境中的指标增长提供了实用蓝图。

Flipkart通过层次化联合设计将Prometheus扩展至8000万指标

InfoQ
InfoQ · 2025-10-18T12:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码