De meilleures autopsies d'incidents
Lorsqu'un incident majeur est en cours, toute votre attention est portée sur le rétablissement du service : surveillez la fumée, déterminez où se trouve l'incendie et éteignez-le. Mais une fois le service rétabli (l'incident est résolu, l'adrénaline s'est dissipée et le calme revient), c'est le moment de tirer les leçons de ce qui s'est passé et d'utiliser ces enseignements pour mieux résoudre, réagir et prévenir les incidents futurs. La meilleure pratique fondamentale qui permet ce cycle d'amélioration est la suivante : processus post-mortem , et PagerDuty est heureux de vous présenter support intégré pour les autopsies dans notre intégralité Plateforme de gestion des incidents du cycle de vie ! Couplé à plusieurs autres fonctionnalités de PagerDuty , telles que Analyse de l'efficacité du système et des opérations et la console de commande des opérations, nous fournissons désormais tout ce dont vous avez besoin pour apprendre et améliorer de manière proactive à la fois la résilience de votre infrastructure et votre processus de résolution.
PagerDuty améliore toutes les parties du processus d'autopsie, de la création de la chronologie jusqu'au suivi de l'état des autopsies. Construisez une chronologie avec les activités pertinentes de PagerDuty et de chat en quelques minutes au lieu de plusieurs heures, puis utilisez cette répartition détaillée pour enquêter efficacement sur la cause profonde, évaluer l'efficacité de la réponse et déterminer les actions de suivi les plus importantes. Nous avons éliminé les frictions liées à la conduite d'autopsies efficaces, afin que vous puissiez consacrer davantage de temps à l'apprentissage et moins au travail manuel. À quel point vos autopsies peuvent-elles être faciles ? Jetons un œil !
Vous pouvez désormais lancer le processus d'autopsie d'un incident en un seul clic :
Enquêter
Une fois le rapport d'autopsie créé, il est temps de retrousser nos manches et de commencer à enquêter sur ce qui s'est réellement passé. Nous voudrons tirer parti de l'activité de nos sources de communication existantes et réponse aux incidents : chat et PagerDuty. Nos informations sur les incidents PagerDuty ont été automatiquement associées à notre nouvelle autopsie, ajoutons donc les canaux de discussion pertinents :
Nous pouvons maintenant examiner l'activité combinée disponible à partir de l'incident et de ces salles de discussion, et inclure dans la chronologie post-mortem exactement les éléments les plus pertinents pour comprendre le déroulement de l'incident. Nous voulons couvrir plusieurs aspects de l'incident : les systèmes technologiques impliqués, l'efficacité de notre réponse et les étapes de résolution.
Chronologie post-mortem
L'ajout d'un élément à la chronologie post-mortem se fait également en un seul clic : pas de copier-coller, pas de basculement entre les applications, pas de calcul manuel du fuseau horaire sujet aux erreurs. L'ensemble des activités de PagerDuty peuvent être incluses : changements d'état d'incident, notes, escalades, notifications, demande d'intervenants supplémentaires, envoi de mises à jour de statut aux parties prenantes, etc. Une fois l'activité dans la chronologie, vous pouvez également l'annoter pour décrire sa pertinence par rapport à l'incident, comme illustré ici :
Analyser
Une fois la chronologie établie, nous pouvons passer à la phase d'analyse. Elle consiste à résumer ce qui s'est passé, à identifier la cause profonde sous-jacente, à indiquer le chemin vers la résolution, etc. Cette étape est essentielle car elle permet à l'équipe d'introspecter ce qui a bien fonctionné et ce qui aurait pu être amélioré, puis d'identifier les améliorations les plus importantes à poursuivre en tant qu'éléments d'action. Tout cela est facile à capturer dans l'éditeur d'autopsie, qui fournit également des instructions pour aborder chacune de ces sections :
Et c'est aussi simple que ça !
Optimisez la gestion post-mortem
Non seulement la construction d'autopsies individuelles est plus simple et plus efficace, mais le processus global est également considérablement simplifié. Toutes les autopsies sont disponibles dans le catalogue.
Cela permet de localiser facilement les post-mortems, d'identifier les incidents de longue durée ayant un impact et de voir quels post-mortems sont toujours en cours ou déjà terminés. Les post-mortems peuvent également être exportés au format PDF pour être distribués ou archivés, et le modèle de rapport ainsi que les instructions par section pour les auteurs peuvent être personnalisés pour répondre aux besoins de votre organisation. Ensemble, tous ces outils offrent un processus de post-mortem complet de bout en bout qui est à la fois facile à utiliser et facile à gérer.
Cette suite de fonctionnalités vous aide à tirer le meilleur parti des autopsies :
- La création d’une chronologie est plus rapide, moins pénible et permet d’avoir des perspectives plus larges.
- Il est beaucoup plus facile de gérer le processus post-mortem avec une chaîne d’outils simplifiée.
- Votre équipe peut accélérer l’amélioration continue en obtenant des apprentissages plus nombreux et de meilleure qualité, tout en consacrant moins de temps au processus.
Nous espérons que cette fonctionnalité permettra à votre équipe de faciliter autant que possible la mise en place d'une culture d'apprentissage partagé. Et si vous souhaitez en savoir plus, téléchargez gratuitement notre manuel d'autopsie pour les meilleures pratiques en matière de conduite d’autopsies efficaces.
PagerDuty Postmortems est inclus pour tous les clients de nos forfaits Standard et Enterprise. Pour commencer, consultez le article de support ici !