Симулятор реагирования на инцидент
P1: triage, mitigate, rollback и postmortem — влияние на MTTR.
Реагирование на P1
Severity, MTTR и blameless postmortem
MTTR (симуляция): 0 мин
Цель зрелой команды — снижать MTTR через runbook и rollback, а не через «героизм».
1
Алерт P1
Мониторинг: 5xx > 15%, latency p99 > 3s
2
Triage
On-call подтверждает инцидент, открывает war room
3
Mitigate
Снизить влияние на пользователей
4
Resolve
Устранить корневую причину или откатить
5
Postmortem
Blameless разбор, action items
Ваше действие на этапе «Алерт P1»