Temps de paix et temps de guerre dans DevOps : les leçons des pompiers
Article de blog invité de Ron Vidal, Rob Schnepp et Chris Hawley de Partenaires Blackrock 3 LLC. Blackrock 3 Partners est un expert en gestion des incidents, combinant des décennies d'expérience dans les services d'incendie, les forces de l'ordre et la lutte contre le terrorisme, dans la gestion des urgences de sécurité publique à grande échelle, avec des décennies d'expérience dans la gestion des opérations Web, des infrastructures critiques, des marchés financiers et des activités de fusions et acquisitions pour les opérateurs internationaux de réseaux à large bande et les sociétés de calcul haute performance.
C'est une journée calme et ensoleillée, comme tant d'autres journées calmes et ensoleillées. Temps de paix jours…
Puis, quelqu’un voit des flammes et de la fumée sortir d’un bâtiment… Temps de guerre…
Appelez le 911… De l’aide est en route!
En quelques secondes, le centre de communication 911 dépêche des camions de pompiers, des ambulances, des équipes de secours et des commandants d'intervention sur les lieux de l'urgence. En environ 4 minutes, les 25 premiers pompiers formés arrivent sur les lieux avec leurs véhicules, leurs outils et leurs compétences spécialisés. Le commandant d'intervention établit le commandement, évalue la situation, fixe les objectifs tactiques, lance les opérations, évalue les ressources nécessaires et organise la résolution efficace de l'urgence.
Cela ressemble-t-il à la manière dont votre équipe DevOps réagit aux incidents de haute gravité ?
Si vous avez des opérations, vous aurez également des opérations d’urgence. Comme une alarme retentit dans une caserne de pompiers, déclenchant immédiatement l’intervention des pompiers, les équipes DevOps doivent réagir avec le même niveau d’urgence pour résoudre leur urgence. Dans les deux cas, le temps presse. Le problème ne s’améliorera probablement pas tant que les bonnes ressources ne seront pas déployées et ne réagiront pas au bon moment, sous la direction d’un leader prenant les bonnes décisions, le tout dans un cadre organisationnel.
Le passage de Temps de paix à Temps de guerre
Temps de paix est le mode de fonctionnement qui se produit au cours des activités quotidiennes normales de toute organisation informatique. Les développeurs écrivent du code. Les opérations assurent le fonctionnement de l'infrastructure. Les affaires comme d'habitude. En d'autres termes, une organisation parfaite Temps de paix jour.
Voici à quoi ressemble un Temps de paix L'organigramme ressemble à ceci :
Temps de guerre est le mode de fonctionnement qui se produit lorsque les systèmes ne sont PAS normaux. Les opérations ont déclaré un événement de niveau SEV et ont lancé un pont de conférence d'incident. Les ingénieurs experts en la matière sur appel interrogent les alertes et examinent les données de performance. Les clients sont hors service. Les affaires ne sont PAS habituelles. Nous avons un problème grave et il doit être résolu, immédiatement. En d'autres termes, un Temps de guerre Incident.
Au sein du Service d'incendie, le passage de Temps de paix à Temps de guerre se produit lorsqu'une urgence est signalée. Temps de guerre est différent. Les gens se comportent différemment. Leur langage et leur méthode de communication sont différents. Les conversations sont généralement beaucoup plus courtes, plus directes et visent à résoudre des problèmes dans un délai restreint. Pour les non-initiés, cela semble abrupt. Cela semble saccadé. Cela semble stérile. Et cela devrait l'être.
Comme 60 minutes Dans une interview du 17 mars 2013 avec Jack Dorsey, le magazine a déclaré : « Le jeune Jack était intrigué par les messages qu’il entendait en provenance du centre de répartition des urgences de Saint-Louis. À la maison, il écoutait tout sur un scanner de la police. Et il était frappé par le fait que tout le monde parlait par courtes rafales de son – un système de communication qui l’a plus tard inspiré à inventer Twitter. »
Dans Temps de guerre , le commandant d'intervention réfléchit plus vite que l'urgence ne se déroule. Pour ce faire, les communications doivent être directes, claires et nettes, comme un « Twitter vocal ».
Compréhension Temps de guerre Communication
Le Temps de guerre l'organigramme sera différent de celui Temps de paix organigramme. En fait, le PDG ( Temps de paix (le leader) est exactement la mauvaise personne pour diriger l'urgence ( Temps de guerre ) réponse, car quelqu'un a toujours la gestion de l'entreprise et des parties non affectées de l'organisation. Rôles et responsabilités, chaîne de commandement et attribution des tâches Temps de guerre seront très différents de ce qu'ils sont dans Temps de paix .
Voici ce qu'un Temps de guerre l'organisation ressemble à :
Voici une comparaison de la manière dont un service d'incendie et DevOps réagissent à une urgence :
Pompiers | DevOps | |
1 | Appelez le 911 | Notification d'alerte |
2 | Dépêche radio | Notifier et rassembler les ressources techniques |
3 | Taille au dessus | Déclarer le niveau de gravité |
4 | Canaux de communication radio tactique | Canaux de communication tactique |
5 | Établir le commandement | Lancer un pont de conférence |
6 | Définir des objectifs tactiques | Faire un plan |
7 | Éteindre le feu | Systèmes de fixation |
8 | Commande de dissolution | Retour aux opérations normales |
En bref, résoudre Temps de guerre les problèmes nécessitent une Temps de guerre mentalité et un processus défini pour la gestion des incidents. Les services d'incendie ont développé un système qui est utilisé depuis plus de 40 ans et qui a géré des dizaines de millions d'incidents. Temps de guerre incidents. Sans aucun doute, les équipes DevOps sont des organisations d’intervention d’urgence, tout comme les services d’incendie.
Lorsqu'une urgence est signalée, c'est un signal clair pour tous que l'organisation est passée de Temps de paix à Temps de guerre . Tous les intervenants doivent comprendre et accepter le sentiment d’urgence et de responsabilité qui accompagne le passage à Temps de guerre et exécuter les tâches qui leur sont assignées en conséquence.
Chaque urgence ( Temps de guerre ) La réponse dépend absolument de communications solides tout au long de l'incident, des notifications d'alerte à la répartition, en passant par les canaux tactiques dédiés et l'escalade jusqu'à la responsabilisation des ressources. Temps de paix a un fouillis de multiples systèmes de communication qui distraient Temps de guerre intervenants. Temps de guerre exige des communications claires pour chaque incident et chaque intervenant d'urgence, et un système centralisé de gestion des incidents aidera à réduire le bruit. Chaque élément de l'urgence ( Temps de guerre ) La réponse aux incidents dépend de communications efficaces et fiables. Sans une communication solide comme le roc, la gestion des incidents échoue.
Alors, la prochaine fois que vous voyez un camion de pompiers se diriger vers une urgence de code 3 (feux et sirène), rappelez-vous simplement qu'ils sont en Temps de guerre et en utilisant les mêmes outils et systèmes que ceux que vous pouvez utiliser pour gérer vos incendies DevOps.
Pour plus d'informations sur Blackrock 3 Partners LLC, veuillez visiter www.blackrock3.com .