Play IT

Симулятор реагирования на инцидент

P1: triage, mitigate, rollback и postmortem — влияние на MTTR.

projectencyclopediaincidents

Реагирование на P1

Severity, MTTR и blameless postmortem

MTTR (симуляция): 0 мин

Цель зрелой команды — снижать MTTR через runbook и rollback, а не через «героизм».

1
Алерт P1
Мониторинг: 5xx > 15%, latency p99 > 3s
2
Triage
On-call подтверждает инцидент, открывает war room
3
Mitigate
Снизить влияние на пользователей
4
Resolve
Устранить корневую причину или откатить
5
Postmortem
Blameless разбор, action items

Ваше действие на этапе «Алерт P1»