- PagerDuty /
- Blog /
- Gestion et réponse aux incidents /
- Tirer les leçons des incidents majeurs : les opportunités que nous manquons
Blog
Tirer les leçons des incidents majeurs : les opportunités que nous manquons
Bien qu’ils soient intempestifs, stressants et susceptibles de mettre en évidence des ruptures de communication au sein d’une organisation, les incidents peuvent être un puissant outil d’apprentissage et de croissance dans les organisations.
Lorsqu'un incident se produit et a de fortes répercussions, comme on le voit dans les actualités chaque semaine, l'accent est souvent mis sur deux choses : stabiliser la situation et contrôler le récit. Les organisations passent souvent à côté des opportunités que présentent les incidents : apprentissage .
Bien que toutes les organisations le feront dire ils soutiennent l'apprentissage, beaucoup n'ont tout simplement pas réalisé l'expertise nécessaire pour déterrer les points de données nécessaires et diffuser ces informations afin que les employés (et les dirigeants) puissent les utiliser pour leur croissance.
La plupart des organisations comptent sur un petit groupe de personnes pour intervenir et commencer à régler la situation. Ce sont des experts qui peuvent souvent déterminer ce qui doit être fait et à qui s’adresser.
L'une des meilleures opportunités qui s'offrent à vous après un incident ? plus experts.
En tant qu'industrie, nous savons que nous avons tendance à trop compter sur l'expertise de quelques ingénieurs et individus pour nous aider dans une situation donnée. En fait, je parie que si je vous le demandais maintenant, vous pourriez facilement énumérer cinq noms de personnes que vous appelleriez en cas d'incident majeur. Ce qui m'inquiète, c'est que la façon dont nous abordons ce problème consiste à remplacer ces humains par GenAI, plutôt que de tirer parti de GenAI pour remplacer ces humains par GenAI. enseigner plus d’humains dans nos organisations et grandir au-delà de ce groupe de cinq humains.
En règle générale, l'expert qui résout une situation ne se rend même pas compte pourquoi ou comment il fait ce qu'il fait – c'est une seconde nature pour lui. Si nous pouvons solliciter le pourquoi et le comment, nous pouvons utiliser les incidents pour constituer un groupe plus large d'experts.
« Certains développeurs de systèmes experts ont observé que des experts hautement qualifiés peuvent effectuer des tâches sans savoir comment ni pourquoi ils le font. »
– Faire attention à la météo, comment les prévisionnistes experts pensent
Voici quelques conseils rapides pour les organisations après un incident majeur (je recommande vivement de lire notre Guide post-incident HOWIE pour des recommandations détaillées) :
- Séparez l'examen public des incidents (avec l'objectif de montrer la confiance du client) de l'examen interne de l'apprentissage. Oui, il est important de partager les choses immédiatement, un « Jour 1 flash ' en quelque sorte. Cependant, il existe également un ' flash du jour 5 ' et un ' flash du jour 30 ', où vous en apprenez davantage (le flash du jour 30 peut tirer des enseignements de l'analyse interne post-incident). Il est important de ne pas faire de promesses lors du flash du jour 1 : vous êtes toujours en ' mode apprentissage ' et si vous le faites, cela peut nuire à la manière dont votre organisation s'améliore.
- Tirez parti d'un technicien qui n'a pas participer à l'incident pour mener l'examen interne de l'incident, les entretiens et les recommandations. C'est important. Souvent, les personnes qui participent à l'incident ont une vision trop étroite pour vraiment déterrer l'image complète. (Avec PagerDuty, vous pouvez travailler avec nous sur ce point, aucun produit n'est associé, juste des experts en analyse d'incidents qui peuvent vous aider à extraire des informations qui peuvent être difficiles à voir lorsque vous y êtes.)
- Prenez le temps de bien comprendre le clivage et les points de vue entre les cadres et les employés techniques en première ligne. Ces points de vue peuvent être exacerbés après un événement majeur et il est impératif que la personne du point numéro 2 recueille les deux points de vue au cours de ses entretiens cognitifs. Une évaluation minutieuse de cette relation permettra à l'analyste d'incidents de fournir des recommandations qui mettent en lumière le meilleur retour sur investissement.
Aucune organisation ne souhaite des incidents publics, coûteux et de grande ampleur. Comme l'a déclaré Jennifer Tejada, PDG et présidente de PagerDuty , CNBC – Les logiciels ne sont pas parfaits. Mais au final, des incidents et des pannes se produisent et GenAI seul ne suffira pas à les résoudre. Ces outils et un processus d'analyse des incidents approfondi et centré sur l'humain peuvent aider les employés à apprendre et à être plus intéressés par l'évolution. Investissez dans la formation et le développement de vos employés, et ils seront non seulement plus susceptibles de rester, mais aussi plus susceptibles d'avoir l'expertise nécessaire pour continuer à développer votre entreprise.