Blog

Optimiser la réponse des entreprises en cas d'incidents techniques

par Georges Miranda 12 août 2019 | 5 minutes de lecture

La plupart des plans de réponse aux incidents techniques tiennent généralement compte des communications avec les parties prenantes, tant pour les équipes internes que pour les clients externes. Mais chez PagerDuty, ce que nous avons appris de nos clients, c'est qu'il existe encore un écart douloureux et coûteux dans l'alignement entre les équipes informatiques et commerciales. Pour combler cet écart, nous devons nous concentrer sur ce que la réponse aux incidents signifie pour équipes commerciales .

Solutions de produits peut aider à relever certains des défis de communications avec les parties prenantes . Mais pour contribuer à une réponse plus efficace au sein d'une organisation, nous avons également besoin de solutions orientées processus pour contribuer à changer nos méthodes de travail actuelles. Nous avons développé deux nouveaux guides opérationnels qui fournissent des cadres pour vous aider à créer des plans d'action clairs qui mobilisent les équipes commerciales en collaboration avec les équipes techniques lorsque des incidents se produisent.

Qu’est-ce que la réponse aux incidents en entreprise exactement ?

Votre PDG est-il disponible en cas de panne de vos services Web ?

Non ? Et bien, ils devraient l'être !

C'est peut-être un exemple extrême, mais il est vrai que l'entreprise dispose également de responsables de l'intervention en cas d'incident (le PDG en fait partie dans l'exemple ci-dessus), qu'ils soient ou non traités comme tels dans votre organisation. Mais le problème est que ces parties prenantes de l'entreprise agissent généralement de leur propre chef, même si elles bénéficieraient grandement de coordonner leur réponse avec des intervenants techniques.

Il ne fait aucun doute que les incidents techniques ont une impact quantifiable sur le chiffre d'affaires et la réputation de votre entreprise. Après tout, lorsque les services commerciaux sont perturbés, les clients s'énervent. Cela est particulièrement visible lorsque les perturbations sont très visibles sur des périodes prolongées.

Par exemple, vous souvenez-vous d'un moment où une application de productivité de bureau essentielle était indisponible pendant quelques heures ? Ou de ce matin où votre site de réseautage social préféré était extrêmement lent ? Sans une réponse appropriée en place, des événements comme celui-ci peuvent provoquer atteinte à la réputation et une perte de revenus importante pour une entreprise. Pour aider à atténuer les dommages causés par les deux, les parties prenantes de l'entreprise s'appuient sur les mises à jour des intervenants en cas d'incident technique afin de pouvoir répondre de manière proactive aux préoccupations des clients.

Si la réponse aux incidents techniques a appris quelque chose à notre secteur, c'est que la clé pour gérer efficacement les catastrophes consiste à définir explicitement des plans d'intervention, avec des rôles et des responsabilités clairs et fréquemment mis en pratique. En bref, nous devons nous préparer aux échecs en nous entraînant constamment et en tirant les leçons de ces échecs lorsqu'ils se produisent.

La réponse aux incidents métier est une application du cadre de réponse aux incidents de PagerDuty pour les intervenants non techniques. Grâce à ce cadre, les intervenants métier peuvent développer un ensemble d'étapes explicites qu'ils peuvent suivre pour atténuer l'impact commercial lorsque des incidents techniques se produisent.

Tout comme pour les incidents techniques, la réponse de l'entreprise varie en fonction de la gravité de l'incident. Les incidents mineurs peuvent simplement nécessiter des communications et des notifications plus détaillées avec les parties prenantes, tandis que les incidents majeurs peuvent nécessiter de réveiller vos équipes de direction et juridiques au milieu de la nuit.

Ces incidents majeurs se produisent sans avertissement, voire sans préavis. La question est donc la suivante : devez-vous attendre une surprise au milieu de la nuit pour déterminer quelles décisions critiques doivent être prises pour atténuer les dommages matériels à la marque de votre entreprise ? Ou cette réponse doit-elle être préparée et examinée avec les parties prenantes critiques, répétée pour identifier et améliorer les lacunes, et avoir des objectifs clairs ? rotations sur appel et politiques d'escalade défini des mois à l'avance ?

Je parie que la plupart des gens voient l’intérêt d’avoir des plans de réponse définis avec des rôles, des attentes et des propriétaires clairs à l’avance, surtout pendant une crise.

Nos nouveaux guides opérationnels de réponse aux incidents commerciaux fournissent un cadre pour élaborer des plans d'action clairs qui mobilisent les équipes commerciales en collaboration avec les équipes techniques lorsque des incidents se produisent. Que vous gériez des incidents majeurs ou mineurs, vous devez disposer d'un plan de réponse de l'entreprise.

Guides étape par étape

Nos nouveaux guides opérationnels fournissent un cadre pour élaborer des plans d’action clairs qui mobilisent les équipes métiers en collaboration avec les équipes techniques lorsque des incidents surviennent. Ces deux guides contribueront à combler l’écart de réponse entre les équipes informatiques et les équipes métiers.

Notre existant réponse aux incidents techniques guide définit les responsabilités d'un Agent de liaison avec la clientèle Et un Liaison interne lors d'un incident. Le nouveau Communications internes avec les parties prenantes Le guide est un manuel complémentaire qui détaille plus explicitement les pratiques de communication efficaces pour vos équipes internes. Le guide détaille les mécanismes de distribution et les considérations de messagerie pour différents supports, tels que l'utilisation de mécanismes permettant une acceptation flexible de la réception de notifications (par exemple une page d'état interne) par opposition à des mécanismes plus statiques comme les listes de distribution par courrier électronique. Il couvre également les considérations relatives à la présentation de points de vue pertinents à différentes parties de l'entreprise.

Le Réponse aux incidents commerciaux Le guide se concentre sur l'atténuation de l'impact commercial lors de la réponse aux incidents techniques les plus graves. Le guide se penche sur les opérations de réponse commerciale qui doivent se dérouler parallèlement aux opérations de réponse technique. La réponse aux incidents commerciaux comprend deux fonctions principales : 1) la transition des opérations commerciales normales en mode d'urgence et 2) la gestion des communications avec les parties prenantes internes/externes. Le guide est un cadre approfondi qui définit les rôles et procédures clés pendant et après un incident technique grave, et est destiné à vous aider à élaborer un plan de réponse commerciale aux catastrophes extrêmes (espérons-le) rares.

Partagez vos expériences avec nous

Ces guides sont destinés à vous aider à démarrer le développement de pratiques de réponse aux incidents métiers qui s'alignent sur les pratiques éprouvées développées par les praticiens techniques. Et même s'ils couvrent deux scénarios particulièrement pénibles auxquels de nombreuses organisations sont confrontées, nous reconnaissons qu'il ne s'agit que de la pointe de l'iceberg lorsqu'il s'agit de définir les nombreux scénarios de réponse aux incidents différents applicables au côté commercial de toute entreprise.

Quels sont les autres problèmes auxquels vous êtes confrontés ? Comment fonctionne la réponse aux incidents opérationnels dans votre organisation aujourd'hui ? Nous aimerions avoir de vos nouvelles et avoir l'occasion de partager et de comparer des expériences qui nous aideront à développer davantage ces guides. Passez nous voir Communauté pour nous laisser un commentaire ou me contacter directement via Twitter , et dites-nous ce que vous en pensez !