小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Data for AI:明其所耗,知其所因!让每一分 Token 消耗都可量化的全栈实践

本文探讨了Agentic AI应用中的Token消耗问题,强调可观测性的重要性。分析了OpenClaw的现状,提出了四种可观测性方案:OTel与亚马逊云科技结合、ClawProbe工具、HTML日志分析和S3与Athena的交互式分析。这些方案旨在帮助企业有效监控和优化Token消耗,确保成本可控。

Data for AI:明其所耗,知其所因!让每一分 Token 消耗都可量化的全栈实践

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-05-27T07:12:57Z
云原生计算基金会宣布OpenTelemetry毕业,巩固其作为事实上的可观测性标准的地位

OpenTelemetry已获得CNCF的毕业认证,成为稳定的开源可观测性框架,旨在标准化遥测数据的收集与处理。自2019年成立以来,该项目吸引了超过12000名贡献者,解决了工具碎片化问题,允许组织在不重写代码的情况下更换分析工具。OpenTelemetry的广泛应用提升了AI和云原生工作负载的实时可观测性,成为现代软件的关键标准。

云原生计算基金会宣布OpenTelemetry毕业,巩固其作为事实上的可观测性标准的地位

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-05-21T14:00:00Z
内部流量治理的演进:OpenResty Edge 在微服务架构中的工程实践

本文探讨了在微服务架构中,通过OpenResty Edge实现内部流量治理的标准化,分析了隐式信任、安全隐患、基础设施能力碎片化、发布风险控制不足和可观测性孤岛等四大痛点。提出集中式可编程网关架构,强调动态热更新、规则引擎和统一控制面等设计原则,以提升安全性、可观测性和工程效率。建议企业逐步推进内部流量治理,确保微服务架构的稳定与安全。

内部流量治理的演进:OpenResty Edge 在微服务架构中的工程实践

OpenResty 官方博客
OpenResty 官方博客 · 2026-05-18T00:00:00Z

OpenTelemetry(OTel)通过三层分离架构(Instrumentation、Export、Backend)解决了可观测性碎片化问题,实现了一次埋点、任意后端的标准化设计。OTel定义了统一的数据模型,支持链路追踪、指标和日志,避免了厂商锁定,适应多云和混合部署,提升了团队协作效率。

一次埋点,任意后端:OpenTelemetry 的可观测性标准化设计

暗无天日
暗无天日 · 2026-05-03T00:00:00Z

文章讨论了AI代理从原型到生产的关键步骤,包括状态管理、密钥安全、信任和可观测性等问题。介绍了三种架构模式及其适用场景,强调配置和治理的重要性。同时提到短期与长期记忆的管理及Agent特有的安全威胁和防范措施。最后,强调了测试和评估的重要性,建议上线前进行严格的质量检查和监控,以确保系统的稳定性和安全性。

读:AI Agent 生产化——一份从原型到上线的速查清单

暗无天日
暗无天日 · 2026-05-01T00:00:00Z
2026 年金融服务行业可观测性现状:从实施到业务影响

2026年金融服务行业的可观测性显著提升,70%的IT领导者认为其实践已成熟。公司需优化可观测性投资,降低成本,满足监管要求。生成式AI的应用率达到94%,提升运营效率。组织需整合数据,建立跨职能团队,以应对复杂环境和监管挑战,推动业务增长与创新。

2026 年金融服务行业可观测性现状:从实施到业务影响

Elastic Blog
Elastic Blog · 2026-04-28T00:00:00Z

可观测性是现代系统管理的重要概念,包含指标、日志、追踪、性能剖析和事件五大支柱。这些支柱帮助工程师理解系统状态和故障原因,强调系统设计的属性。通过有效的数据采集与分析,团队能够快速定位问题,优化系统性能,提升用户体验。

【可观测性工程】可观测性全景:Metrics、Logs、Traces、Profiles、Events 五大支柱

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

监控与可观测性是不同的概念,监控关注预设问题和指标,而可观测性能够回答任意问题。传统的监控工具如Nagios和Zabbix逐渐被Prometheus和OpenTelemetry取代,后者支持更灵活的数据模型和多维度分析。可观测性强调记录足够的上下文信息,以便在故障发生时进行深入分析。随着微服务和复杂系统的普及,传统监控已无法满足需求,行业正向统一的可观测性平台发展。

【可观测性工程】可观测性 vs 监控:从 Zabbix/Nagios 到 OpenTelemetry 的二十年

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

本文探讨了事件作为可观测性的重要支柱,强调其与日志的本质差异。事件是系统状态转移的关键数据,有助于快速定位事故根因。文章介绍了变更事件、基础设施事件和业务事件的分类,以及如何通过CloudEvents标准化事件模型。同时,讨论了Kubernetes事件API和事件流平台(如Argo Events、Keptn)的应用,强调事件在事故响应中的重要性,并提出“变更即根因”的方法论,以提高故障排查效率。

【可观测性工程】Events 与变更关联:CloudEvents、发布打点、K8s 事件

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

eBPF(扩展伯克利包过滤器)是一种内核技术,允许动态挂载小程序以采集系统事件,解决了传统监控的痛点,实现零侵入、内核级可见性和低开销。文章介绍了eBPF的可观测性路径,包括bcc、bpftrace和libbpf + CO-RE,分析了钩子类型及应用场景,并提供了实际案例和选型建议。eBPF的应用使内核成为重要的数据源。

【可观测性工程】eBPF 可观测性全景:bcc、bpftrace、libbpf 的工程路径

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

持续性能分析作为可观测性的第四支柱,旨在以低开销、全实例、永远在线的方式采集系统性能数据。与传统的按需触发分析不同,持续性能分析能够实时监测系统性能,帮助工程师快速定位性能瓶颈。本文介绍了持续性能分析的理论基础、主流开源方案(如Parca、Pyroscope、Grafana Beyla)、跨语言符号解析及实际案例,旨在帮助读者选择合适的方案并实现可运维的性能分析平台。

持续性能分析(Continuous Profiling):Parca、Pyroscope、Grafana Beyla

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

现代可观测性是一个复杂的工程体系,涉及数据模型、传输协议和存储结构。本文针对SRE、平台工程师和架构师,探讨如何优化可观测栈、选择合适工具以及治理SLO与告警。内容包括可观测性基础、三大支柱、eBPF与内核可观测性,以及治理与工程落地,适合相关专业人士阅读。

可观测性工程

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z

大模型系统的可观测性与传统微服务不同,需关注请求成本、延迟和正确性等多维度指标。文章提出四层观测模型:基础设施层、调用层、质量层和业务层,并推荐使用多种工具(如Langfuse、Helicone等)进行监控。可观测性应能快速定位问题并修复,以确保用户体验。

【大模型基础设施工程】23:LLM 可观测性

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-22T00:00:00Z
Google ADK 是如何实现可观测的?

文章讨论了Google ADK的可观测性,强调在智能体交互中识别性能瓶颈的重要性。可观测性有助于发现问题、止损、报告和改进。ADK支持多种可观测平台,简化集成过程,通过监控链路和性能数据提升系统的可用性和优化能力。

Google ADK 是如何实现可观测的?

Ying’s Blog
Ying’s Blog · 2026-04-18T06:18:16Z
Bitmovin 扩展实时编码和可观测性解决方案,实现端到端实时流媒体监控

Bitmovin扩展了其实时编码和可观测性解决方案,实现对直播工作流程的实时监控,整合编码与播放数据,帮助视频服务提供商检测问题。新平台提供会话级洞察,分析编码配置对播放质量的影响,并支持在智能电视上测试实时编码,提升直播可观测性。

Bitmovin 扩展实时编码和可观测性解决方案,实现端到端实时流媒体监控

实时互动网
实时互动网 · 2026-04-10T02:16:11Z
联络中心 AI 的下一阶段在于控制,而非采用

企业在AI系统应用中需关注可观测性、测试和治理,以确保系统可靠并满足客户需求。AI的价值在于持续优化,而非仅仅部署。各部门应共同定义“生产就绪”,并加强对AI表现的监控与责任。

联络中心 AI 的下一阶段在于控制,而非采用

实时互动网
实时互动网 · 2026-04-10T02:11:53Z
netcorepal-cloud-framework v3.3.0 发布:增强可观测性,补强时间处理与代码分析体验

netcorepal-cloud-framework v3.3.0 正式发布,增强了可观测性、时间字段处理、代码分析可视化体验及稳定性,新增中英文文档,支持 UTC 转换,修复可视化问题并更新依赖。建议用户关注链路追踪配置及代码分析效果。

netcorepal-cloud-framework v3.3.0 发布:增强可观测性,补强时间处理与代码分析体验

dotNET跨平台
dotNET跨平台 · 2026-03-31T00:01:57Z
【译】 数据摄取构建模块简介(预览版)(二)

本文介绍了数据摄取管道的处理过程,包括数据块的丰富、存储和检索。使用SummaryEnricher为数据块添加摘要,并通过SQLite存储处理后的数据。IngestionPipeline支持文件处理和部分成功的导入机制,并展示了如何配置分布式应用程序以实现数据摄取和可观测性。

【译】 数据摄取构建模块简介(预览版)(二)

dotNET跨平台
dotNET跨平台 · 2026-03-24T00:01:12Z
当我们在维护模型 API 服务时我们在维护什么

本文讨论了团队在构建AI服务时的经验教训,强调了项目结构、配置分层、模型版本迭代和可观测性等关键设计原则。通过引入版本子目录和动态注册机制,简化了多版本管理,确保了API的稳定性和可维护性。同时,文章还分享了一些开发流程和CI/CD的最佳实践,以提高团队的工作效率和代码质量。

当我们在维护模型 API 服务时我们在维护什么

Manjusaka
Manjusaka · 2026-03-15T14:00:00Z
我为 Memos 做了一个图片渲染服务

我为Memos设计了独立的图片渲染服务,使用Playwright进行截图,解决了渲染时机和性能优化问题。通过职责分离,后端专注于数据管理,渲染服务专注于图像生成。实现了两种渲染模式,优化了浏览器性能,并增强了可观测性,确保服务稳定运行。

我为 Memos 做了一个图片渲染服务

Shadow Walker 松烟阁
Shadow Walker 松烟阁 · 2026-02-23T09:00:30Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码