- PagerDuty /
- Blog /
- Meilleures pratiques en matière de gestion des incidents /
- Analyse d’incident : qui interviewer ?
Blog
Analyse d’incident : qui interviewer ?
Cet article a été initialement publié sur le blog de Jeli. Jeli a été racheté par PagerDuty en 2023 et nous le republions ici pour apporter leur leadership éclairé à notre communauté.
Prendre le temps d'interroger les participants après un incident nous permet de révéler l'expertise de chacun et de la partager au sein de l'organisation. Les entretiens génèrent des témoignages à la première personne qui mettent en évidence les connaissances inhérentes à vos équipes (ainsi que les lacunes), les stratégies utilisées par les ingénieurs pour gérer les comportements inattendus des systèmes et les difficultés qui ont entravé les efforts de restauration du service. Il s'agit d'informations cruciales à recueillir. Elles aident tout le monde à tirer des leçons plus facilement de l'expérience, même ceux qui n'étaient pas là, et donnent à l'organisation l'occasion d'examiner comment les pratiques et les processus existants aident ou entravent lors des incidents.
Tout cela pour dire que l'entretien est une utilisation judicieuse du temps que vous passerez à enquêter. Il vous donne des informations très précieuses pour compléter vos examens de transcription et peut être le moyen le plus efficace d'aller au cœur de ce qui compte dans cet incident particulier. Dans cet article, nous supposerons que vous en êtes conscient et que vous êtes en mesure de prendre le temps de l'entretien.
Qui devriez-vous interviewer ?
Vous êtes donc convaincu par l'idée de mener des entretiens. Vous vous dites peut-être : « Il y avait plus de 200 personnes impliquées dans cet incident, et plus de 20 étaient très actives ! Comment vais-je pouvoir mener à bien tous ces entretiens critiques avant ma rétrospective de l'incident dans 5 jours ?! » La bonne nouvelle est que lorsque vous avez commencé votre analyse initiale et commencé à comprendre l'événement, vous avez déjà effectué une partie du travail de fond nécessaire pour identifier les acteurs clés ! La meilleure nouvelle est que les experts font ce travail depuis des années, vous n'avez donc pas besoin de tout recommencer à zéro.
Comme souligné dans le Guide Howie Voici quelques éléments à prendre en compte lorsque vous décidez qui interviewer :
- Acteurs clés des moments clés
Détection, diagnostic ou résolution de l’incident : si quelqu’un était fortement impliqué dans l’un de ces événements ou a mené la charge, planifiez-le.
Les acteurs clés impliqués dans l'incident sont généralement (mais pas toujours !) des personnes qui peuvent vous donner des perspectives à la fois générales et spécifiques sur l'événement. Par exemple, une perspective générale peut provenir du commandant de l'incident qui a géré les activités liées à l'incident. Sa vue d'ensemble de l'événement vous aidera à vous orienter rapidement sur l'incident. Une autre personne clé pourrait être l'intervenant qui a identifié le problème ou a proposé l'atténuation/la réparation. Il peut vous aider à comprendre les détails techniques plus spécifiques de la panne. Les acteurs clés proviennent également du support client, de l'ingénierie sur le terrain, de la gestion de la réussite client et du côté des ventes de l'entreprise. Souvent, ces acteurs clés dans les incidents étaient les personnes qui ont apporté des informations opportunes et spécifiques du point de vue des clients. Selon les règles de votre organisation, même les clients eux-mêmes peuvent être interrogés car ils constituent de profonds réservoirs de contexte et d'informations ! L'objectif le plus important des entretiens avec les personnes clés est de maximiser les informations que vous recevez du temps que vous passez à parler aux personnes impliquées. - Des personnes dont vous ne vous attendiez pas à ce qu'elles soient impliquées dans l'incident
Cela peut inclure des personnes qui n’étaient pas de garde ou qui ne faisaient pas partie de l’équipe du système impacté.
Peu importe qu'ils aient été impliqués dans l'incident ou qu'ils y soient intervenus de leur propre chef, prendre le temps d'interroger ces personnes peut vous donner un aperçu de leur expertise (perçue ou non !). En général, lorsqu'une personne est intentionnellement impliquée dans un incident, c'est parce qu'elle possède des connaissances sur un système qui la rendent incroyablement utile au cœur de l'incident. En les interrogeant et en partageant ces conclusions lors de votre réunion de facilitation, vous pouvez commencer à diffuser cette expertise de sorte que, par exemple, « Suzie » ne soit plus la seule personne à savoir comment fonctionne le consul. - Les personnes qui peuvent se sentir blâmées
Il est important que les personnes qui se sentent d’une certaine manière « responsables » de l’incident puissent partager leur point de vue lors d’une entrevue afin que leur expérience puisse être représentée avec précision dans l’enquête.
Ces entretiens sont essentiels pour créer un environnement psychologiquement sûr. Il est important que les gens aient le sentiment que leur point de vue est non seulement entendu mais également représenté de manière équitable, et qu'ils ne seront pas tenus pour responsables des incidents. Ces entretiens peuvent également faire apparaître d'autres facteurs contributifs autour des processus organisationnels qui auraient pu être omis dans d'autres sources de données. - Propriétaires, propriétaires présumés ou propriétaires contestés des systèmes concernés
Les anciens propriétaires peuvent également être des personnes intéressantes à interviewer.
Ces personnes ont généralement un niveau élevé de compréhension du système, ce qui peut permettre une rétrospective plus productive et une rédaction plus riche après l'incident. Des connaissances apparemment basiques sur le fonctionnement de l'ensemble du système placent l'incident dans un contexte précieux qui, une fois inclus dans votre compte rendu d'incident, le rend plus susceptible d'être lu et partagé par la suite. - Experts en la matière (PME) et personnes qui vivent sur des « îlots de connaissances »
Il est recommandé d’interviewer toute personne possédant une expertise dans le(s) système(s) ou les composants impliqués dans l’incident. Et ceux qui sont « la seule personne qui sait comment résoudre une panne » représentent une expertise en la matière qui devrait être plus largement diffusée.
Tout comme les propriétaires, les entretiens avec des experts en la matière peuvent aider à mieux identifier le niveau d’expertise réel requis pour exploiter le système. Souvent, les experts ont du mal à documenter et à expliquer leur expertise. Les interroger (même avec des questions très simples) peut donc faire ressortir ces connaissances. Nous demandons souvent aux PME « dans quelle mesure cette expertise est-elle connue au sein de votre équipe » et nous constatons qu’un nombre surprenant de fois la réponse est « pas du tout connue ». Ces éléments indiquent que le partage de ces connaissances dans un rapport ou une revue d’apprentissage est un moyen de briser les silos de connaissances et une opportunité de formation pour que d’autres puissent développer cette expertise plus largement. - « Loups solitaires »
Les personnes qui agissent indépendamment de l’effort du groupe peuvent indiquer qu’elles ont une perspective différente sur le fonctionnement du système.
Les loups solitaires sont souvent considérés comme contre-productifs en matière de réponse aux incidents, mais il vaut la peine de chercher à comprendre pourquoi ils n’ont pas coordonné leur activité avec les autres. Ces entretiens pourraient révéler des problèmes potentiels liés à la dynamique de l’équipe, aux processus ou aux canaux de communication qui peuvent avoir contribué à cette action indépendante. - Le rédacteur du ticket et/ou la personne qui a rédigé le changement
Personne qui a rédigé le ticket qui a incité la personne à écrire des modifications liées à l'incident et/ou la personne qui a écrit ladite modification.
Interroger ces personnes peut nous donner un contexte important sur les étapes qui ont conduit à l’incident. Poser des questions telles que « Avons-nous eu le bon contexte concernant le système et l’organisation lorsque nous avons rédigé ce ticket ? Qu’est-ce qui a conduit à sa publication ? » - Les personnes qui sont nouvelles dans l’organisation
C'est assez explicite. Demandez aux débutants.
Interviewer ces personnes peut nous aider à faire émerger des hypothèses cachées sur nos systèmes.
Travailler avec des contraintes de temps
Cet article s'est concentré sur les personnes à interviewer dans le cadre de votre quête visant à faciliter une rétrospective d'incidents axée sur l'apprentissage. Cependant, nous sommes tous confrontés à des contraintes de temps qui nous obligent à faire des compromis lors des entretiens.
Si vos interlocuteurs cibles ne sont pas disponibles ou si vous manquez de temps avant de devoir remettre un rapport ou animer une réunion, voici quelques suggestions sur la manière de gérer la situation :
- Commencez par séquencer vos entretiens « à forte valeur ajoutée » afin d’obtenir le plus de contexte possible en peu de temps.
- Réduisez la durée de vos entretiens au lieu de les éliminer complètement
- Posez les questions dans un message direct ou dans un document Google pour permettre à la personne interrogée de répondre de manière asynchrone
- Préparez un résumé basé sur d'autres informations que vous avez recueillies et demandez à la personne interrogée si elle est exacte et de fournir des commentaires. Cela permet de cibler le temps dont elle dispose pour vérifier et clarifier plutôt que pour construire une compréhension.
- Efforcez-vous de terminer vos entretiens lorsque la quantité de nouvelles informations pertinentes diminue sensiblement.
- Utiliser un document d'étalonnage pour permettre des discussions asynchrones continues
Prendre le temps de discuter avec les intervenants au moyen d'entretiens peut nous aider à faire émerger des connaissances sur nos systèmes, à la fois techniques et sociotechniques, qui nous permettront d'être plus résilients face aux incidents à venir. Pour des informations plus détaillées sur ces sujets et d'autres, vous pouvez toujours consulter le Howie : Le guide post-incident , notre guide étape par étape, prêt à l'emploi, pour l'analyse des incidents.