ONCALL是指在非工作时间保持待命解决服务稳定性问题的一种机制。建立ONCALL机制可以预防故障发生、提高可用性、减少损失和负面影响。搭建ONCALL团队、培训人员、建立流程和沉淀操作手册是做好ONCALL的关键。故障通知机制分为三个阶段,包括内部和外部通知。故障复盘是分析故障、改进流程和减少类似问题发生的重要实践。
完成下面两步后,将自动完成登录并继续当前操作。