Les systèmes complexes sont interconnectés. Lorsqu'un incident se produit, il n'est pas déclenché par un événement unique, mais plutôt par une série d'événements conduisant à cette défaillance. Pourtant, les équipes utilisent l'analyse des causes profondes (RCA) comme principal moyen d'identifier une cause ultime et suffisante.
Robert Blumen, ingénieur DevOps en chef chez Salesforce, explique que ce n'est pas la cause unique qui doit être examinée de plus près, mais plutôt la série d'événements. Il passe en revue les raisons pour lesquelles les humains sont cognitivement attirés par l'analyse des événements, les recherches et les exemples sur l'analyse des événements, et soutient que c'est le « comment » - et non le « pourquoi » - que nous devons explorer lorsque les systèmes échouent.
Objectifs d'apprentissage :
- Apprenez à identifier les problèmes sans analyse des causes profondes
- Découvrez « comment » explorer les systèmes en cas de défaillance
« Le PagerDuty Operations Cloud est essentiel pour TUI. C'est ce qui va réellement nous aider à nous développer en tant qu'entreprise pour garantir que nous fournissons des services de qualité à nos clients. »
- Yasin Quareshy, responsable de la technologie chez TUI