Suivi de la réponse de votre organisation avec les notes de réponse
De combien de temps disposez-vous ? C'est peut-être dû à notre culture de l'impatience, à l'art d'être manager, ou peut-être simplement à mon âge avancé, mais j'ai commencé à vraiment apprécier les gens qui m'entourent et qui peuvent communiquer l'état actuel du monde de manière concise. Ce niveau de détail supplémentaire n'est pas toujours nécessaire.
Répondre aux incidents critiques est une course contre la montre. Pour commencer, vous essayez souvent de déterminer OMS est sur ce chemin critique vers la résolution. Au fur et à mesure que de plus en plus de personnes s'impliquent dans l'incident (grâce à Mobilisateur de réponse ), le volume global de communication augmente rapidement, surtout si vous utilisez le chat comme principal moyen de collaboration. Les renforts n'arrivent pas non plus tous en même temps. Votre efficacité à résoudre les problèmes en tant que commandant d'incident dépend de la rapidité avec laquelle vous êtes capable de former les nouveaux intervenants à l'état actuel du monde. Officiellement, cela s'appelle établir terrain d'entente . ( Dan Slimmon d'Exosite a un discours fantastique de Velocity Santa Clara 2016 sur ce sujet précis si vous êtes intéressé. )
De nombreuses organisations améliorent la réponse aux incidents grâce au chat comme moyen de communication lors d'incidents. Comme les ponts de conférence, le chat est idéal pour l'interaction ; et comme les ponts de conférence, le chat est un horrible choix pour établir un terrain d'entente pour les intervenants nouvellement rejoints. Si c'est ainsi que vous réagissez aux incidents, vous perdez probablement un temps précieux et prolongez votre TTR.
Pourquoi votre calendrier de discussion est inefficace
Beaucoup de nos clients utilisent le chat pour communiquer lors d’un incident de grande ampleur afin d’encourager la collaboration et la transparence. Cependant, un modèle anti-modèle a commencé à émerger autour de la réponse aux incidents basée sur le chat. Pour les incidents de grande ampleur, le coût de demander aux intervenants de « lire le backlog » afin d’accélérer la réponse à l’incident est bien plus élevé que vous ne le pensez. Que doit faire un intervenant nouvellement intégré ? vraiment dois savoir?
- Quels sont les problèmes (par exemple, les symptômes connus) ? Quel est l'impact connu sur les clients ?
- Qui est actuellement engagé (par exemple, qui est le commandant de l’incident) ?
- Quelles mesures ont été prises ? Quelles décisions ont été prises ? Quelles hypothèses existent pour expliquer ce qui se passe ?
Vous pouvez certainement obtenir ces informations à partir de votre chronologie de discussion (ou même en interrompant et en demandant à tout le monde sur le pont !), mais il doit y avoir un meilleur moyen.
Notes pour la vitesse
Aujourd’hui, nous introduisons une nouvelle fonctionnalité permettant de faire apparaître plus facilement les notes d’incident afin de capturer les actions ou décisions clés prises en rapport avec un incident à grande échelle.
Ces notes peuvent même être capturées facilement via l'application mobile :
Dans notre réponse aux incidents chez PagerDuty, nous assignons un scribe d'incident dédié comme l'un de nos rôles critiques (en plus du commandant d'incident). Cette personne est responsable de l'importante « analyse par action » concernant l'incident, ce qui constitue un moyen simple d'attirer de nouveaux intervenants qui s'engagent sur un incident en vol. Les notes du scribe sont également la meilleure ressource pour créer une chronologie organisée pour les autopsies.
Fini les discussions en ligne bruyantes. Essayez cette nouvelle fonctionnalité et dites-nous ce que vous en pensez !
Inscrivez-vous gratuitement à PagerDuty .