小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
百度的无人出租车在交通中发生故障,造成混乱

百度的Apollo Go无人出租车在武汉发生系统故障,导致乘客被困车内,造成交通混乱。警方已接到多起报告,此事件引发了对中国自动驾驶汽车安全性的讨论。

百度的无人出租车在交通中发生故障,造成混乱

The Verge
The Verge · 2026-04-01T10:39:52Z
Railway强调日志、指标、追踪和警报在诊断系统故障中的重要性

Railway的工程团队发布了可观察性指南,介绍开发者与SRE团队如何结合日志、指标、追踪和警报来诊断系统故障。文章强调四个核心支柱:日志提供事件上下文,指标反映系统健康,追踪请求流向,警报监控服务目标。这些信号的结合可加速根本原因分析,提高故障响应能力。

Railway强调日志、指标、追踪和警报在诊断系统故障中的重要性

InfoQ
InfoQ · 2026-01-28T12:00:00Z
演讲:循环中的人类:混乱行业中的工程领导力

米歇尔·布拉什是一名站点可靠性工程师,专注于分析系统故障并降低风险。尽管科技行业面临挑战,她仍对未来持乐观态度,并鼓励儿子学习计算机科学。她指出,随着AI/ML的发展,工程师的工作将变得更加复杂,需求也将增加,因此需要掌握系统思维、可靠性工程和应对复杂性的能力。

演讲:循环中的人类:混乱行业中的工程领导力

InfoQ
InfoQ · 2025-11-24T11:08:00Z
错误处理:异常好于状态码

错误处理主要有两种方式:抛出异常和返回状态码。抛出异常使代码更简洁,避免繁琐的错误检查,并提供详细的错误信息;而状态码可能会隐藏错误,导致系统故障。总体来看,异常处理优于状态码。

错误处理:异常好于状态码

阮一峰的网络日志
阮一峰的网络日志 · 2025-10-21T16:28:41Z
Linux 桌面系统故障排查指南(六) - 系统关机与电源管理

本文讨论了Linux系统的关机、休眠和挂起流程及故障排查。关机分为用户会话清理、系统服务停止、内核资源释放和硬件关机四个阶段。休眠将数据保存到磁盘并断电,而挂起则保持内存供电。文章还提供了故障排查和优化建议,以提升系统稳定性和用户体验。

Linux 桌面系统故障排查指南(六) - 系统关机与电源管理

This Cute World
This Cute World · 2025-10-19T02:22:33Z
Linux 桌面系统故障排查指南(五) - 网络

本文介绍了Linux网络系统架构,包括网络连接、管理、故障排查和防火墙配置,重点讲解了systemd-networkd、iwd、nftables等工具的使用,以及IPv4/IPv6双栈配置和网络性能优化方法。

Linux 桌面系统故障排查指南(五) - 网络

This Cute World
This Cute World · 2025-10-19T02:21:33Z
Linux 桌面系统故障排查指南(四) - 多媒体处理与中文支持

本文探讨了Linux桌面系统的多媒体处理能力,重点介绍了PipeWire在音视频统一管理中的作用,以及fontconfig和fcitx5在中文支持方面的贡献。PipeWire通过低延迟和硬件兼容性解决了音视频处理的割裂问题,成为Linux桌面视频处理的标准。fontconfig和fcitx5则为用户提供了优质的中文输入和显示体验。

Linux 桌面系统故障排查指南(四) - 多媒体处理与中文支持

This Cute World
This Cute World · 2025-10-19T02:20:33Z
Linux 桌面系统故障排查指南(三) - 桌面会话与图形渲染

本文探讨了Linux桌面系统的图形架构,包括用户登录、应用渲染流程,以及Wayland与X11的区别。重点介绍会话管理、设备权限和故障排查,强调Wayland在性能和安全性上的优势。

Linux 桌面系统故障排查指南(三) - 桌面会话与图形渲染

This Cute World
This Cute World · 2025-10-19T02:19:33Z
Linux 桌面系统故障排查指南(二) - systemd 全家桶与服务管理

本文探讨了 systemd 的核心功能及其生态系统,包括服务管理、依赖关系、资源控制和设备管理。重点介绍了 systemd-journald、systemd-oomd、systemd-resolved 等服务,以及 D-Bus 作为进程间通信机制的重要性,强调了 systemd 在现代 Linux 系统管理中的关键作用。

Linux 桌面系统故障排查指南(二) - systemd 全家桶与服务管理

This Cute World
This Cute World · 2025-10-19T02:18:33Z
Linux 桌面系统故障排查指南(一) - 系统启动与安全框架

本文介绍了Linux桌面系统的启动机制和安全框架,包括UEFI引导、内核加载、initramfs和systemd服务启动,重点分析了PAM和PolicyKit等组件在系统安全中的作用,并提供了故障排查流程及常见问题解决方案。

Linux 桌面系统故障排查指南(一) - 系统启动与安全框架

This Cute World
This Cute World · 2025-10-19T02:17:33Z
Linux 桌面系统故障排查指南(零) - 组件概览

本文介绍了Linux桌面系统的组件及故障排查方法,帮助用户深入理解系统架构。通过从开机到关机的时间线,解析各环节的工作原理、日志证据及常见问题的解决思路,提供系统化的排查指南。

Linux 桌面系统故障排查指南(零) - 组件概览

This Cute World
This Cute World · 2025-09-09T12:17:33Z
凯瑟医疗公司系统故障导致药房依赖手动填写处方

凯瑟医疗公司因系统故障,医院和药房需手动填写处方,服务受到影响。公司正在解决问题,部分服务可能延迟,用户可访问官网获取最新信息。

凯瑟医疗公司系统故障导致药房依赖手动填写处方

The Verge
The Verge · 2025-05-29T13:51:26Z
微软发布 Agentic AI 系统故障模式综合指南

微软AI Red Team发布了关于Agentic AI系统故障模式的分类报告,强调了安全性和保障性的新挑战。报告指出了多种安全故障及其缓解策略,强调在设计中融入安全性和负责任的人工智能原则,以确保系统可靠性和用户信任。

微软发布 Agentic AI 系统故障模式综合指南

实时互动网
实时互动网 · 2025-04-28T02:24:29Z
云灾难恢复:现代企业的生命线

云灾难恢复(CDR)是企业的重要策略,通过安全的云环境备份和存储数据,确保在系统故障、网络攻击或自然灾害时快速恢复。CDR能有效减少停机时间,保护数据,具备可扩展性和成本效益,适应企业发展,并满足合规要求。

云灾难恢复:现代企业的生命线

DEV Community
DEV Community · 2025-04-25T14:34:21Z
职场生产力保险的未来 - 2025年

2025年,职场生产力保险成为新趋势,旨在保护企业免受系统故障、员工疲惫和网络攻击等导致的生产力损失。该保险涵盖技术故障、员工健康、网络安全和数据监控,帮助企业在混合和远程工作模式下保持生产力,成为现代商业的战略工具。

职场生产力保险的未来 - 2025年

DEV Community
DEV Community · 2025-04-22T04:11:59Z
为什么你应该认真对待更多事件!

为了提高事件响应能力,行业需要更多事件来审视期望与现实的差距。通过频繁声明事件,团队可以积累数据,提升协调能力,减少对惩罚性指标的依赖,从而更有效应对系统故障。

为什么你应该认真对待更多事件!

engineering on Grafana Labs
engineering on Grafana Labs · 2025-04-14T00:00:00Z
预测遗留系统故障:在SageMaker中训练和托管机器学习模型

本文介绍了如何利用Amazon SageMaker训练模型,预测COBOL批处理作业的失败。通过分析输入元数据和内容特征,构建训练数据集,使用XGBoost进行模型训练,并在实时端点上部署。该模型能够在作业运行前预测失败风险,从而提高遗留系统的可靠性,减少计算资源浪费。

预测遗留系统故障:在SageMaker中训练和托管机器学习模型

DEV Community
DEV Community · 2025-04-07T13:08:13Z
AI代码盲点问题:为什么你的技术团队正在失去对代码库的控制

AI生成的代码正在迅速增加,未来可能占到75%以上。工程师面临“代码盲点”问题,难以理解和管理AI生成的代码,可能导致系统故障和业务损失。解决方案包括改进分析工具、进行代码审查和错误检测。Hexmos的LiveAPI产品旨在提高团队对API的可见性,帮助管理AI驱动的开发。

AI代码盲点问题:为什么你的技术团队正在失去对代码库的控制

DEV Community
DEV Community · 2025-01-24T17:32:19Z
在2025年,我决心主动关注系统可靠性

开发者需在2025年前主动防范系统故障,确保变更不影响性能和可靠性。目前的监控工具缺乏分析能力,导致开发效率低下和用户信任下降。因此,需要建立能够预测变更影响的系统,以提升开发的安全性和效率。

在2025年,我决心主动关注系统可靠性

DEV Community
DEV Community · 2025-01-21T20:07:35Z

1月16日下午,支付宝疑似出现系统故障,导致任意付款自动叠加20%政府补贴,持续约5分钟。网友分享的截图显示转账和充值均享受此优惠,事件真实性尚未确认,支付宝尚未回应。

网传支付宝出现P0级事故 任意类型付款甚至转账都自动叠加国补优惠20%

蓝点网
蓝点网 · 2025-01-16T11:09:26Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码