Blog

Shadow Like a Dutonian : Intégration des ingénieurs avec l'observation sur appel

par Max Timtchenko 26 mars 2019 | 7 minutes de lecture

Pourquoi nous utilisons l'observation sur appel

L'observation sur appel est une pratique essentielle chez PagerDuty. Pour un nouvel ingénieur, une période d'observation constitue une préparation plus douce et plus fluide à la mise en disponibilité, sans le stress ni la responsabilité de diagnostiquer et de résoudre le problème.

Lorsque nous configurons l'observation dans PagerDuty, notre objectif est de simuler le processus et actions de mise en disponibilité aussi précisément que possible tout en veillant à ce que les actions de l'« utilisateur fantôme » n'affectent pas l'ingénieur principal qui est réellement de garde. Cela permet à l'utilisateur fantôme d'être confiant et à l'aise avec nos processus, tandis que l'intervenant principal de garde peut toujours effectuer ses actions sans être découragé.

Comment nous utilisons l'observation

La première étape consiste à créer un compte PagerDuty dédié à l'observation. Sur ce compte Shadow, nous ajoutons des services et des intégrations de messagerie pour les équipes observées. Un service par équipe suffit si votre équipe n’a qu’une seule personne à la fois ; davantage peut être nécessaire si plusieurs personnes suivent la même équipe.

Les adresses e-mail utilisées par ces intégrations sont, à leur tour, configurées comme méthodes de notification pour un utilisateur fantôme sur le compte principal PagerDuty , qui est ajoutée à la politique d'escalade d'astreinte du compte principal pour l'équipe à observer.

Grâce à cette configuration, lorsqu'un incident survient, une notification est envoyée à l'utilisateur principal d'astreinte et à l'utilisateur fantôme du compte principal. Cela crée un incident distinct avec les mêmes informations dans le compte fantôme. Le compte fantôme informe l'utilisateur fantôme et, comme il s'agit désormais d'un incident distinct, il peut faire tout ce qu'il veut (accuser réception, suspendre, ajouter des commentaires, etc.) sans modifier le statut de l'incident réel sur lequel travaille l'utilisateur principal d'astreinte.

L'un des avantages de cette configuration est qu'une fois configurée, la configuration du compte principal reste statique. Les personnes qui effectuent une observation sont ajoutées, supprimées et configurées entièrement dans le compte fantôme. Un autre avantage est la possibilité de modifier le calendrier d'observation pour exclure les week-ends, les jours de transfert d'astreinte, etc., et peut même être configuré pour effectuer une observation uniquement pendant les heures ouvrables. (Notez que l'utilisateur fantôme ne doit pas être ajouté à la rotation d'astreinte.)

Comment nous mettons en place l'observation

Examinons les étapes en détail. Si l'une des étapes n'est pas claire, consultez ce webinaire de configuration et de formation des intervenants qui passe en revue de nombreuses étapes de configuration utilisées ci-dessous.

Créer un compte fantôme

Si vous n'avez pas encore de compte PagerDuty , vous pouvez mettre en place un essai gratuit à suivre sans aucune condition.

Créer un utilisateur d'espace réservé

Lorsqu'il n'y a personne qui suit, il s'agit de l'utilisateur qui sera utilisé par tous les plannings de suivi sur le compte de suivi. Il ne contacte personne. Lorsqu'il y a des personnes qui suivent, elles remplacent l'utilisateur de l'espace réservé sur le planning correspondant.

 

Créer un planning

Les trois entités suivantes (planification, politique d'escalade et service) sont créées par équipe et par shadow simultané. Cela permet de garder tout organisé et séparé. Si vous configurez un seul poste shadow dans une seule équipe, un seul ensemble suffit.

Pour cet exemple, nous utilisons une équipe fictive « Labs ». Ajoutez l'utilisateur d'espace réservé au planning et configurer le planning à ce qui fonctionne le mieux pour votre équipe.

Créer une politique d'escalade

Affecter le planning nouvellement créé à un politique d'escalade .

Créer un service

Créer un service , activez l'intégration de messagerie et notez l'adresse e-mail (dans ce cas, labs-shadow-1@example-shadow.pagerduty.com). C'est à cet endroit que les notifications du compte principal seront envoyées. Choisissez la politique d'escalade créée lors de l'étape précédente. Les autres paramètres peuvent rester à leurs valeurs par défaut.

Créer un utilisateur fantôme sur le compte principal

Passez à votre compte principal et créez un utilisateur fantôme qui générera des événements pour le compte fantôme. Il n'y a qu'un seul utilisateur fantôme par équipe, même s'il existe plusieurs services fantômes sur le compte fantôme. En répertoriant plusieurs adresses e-mail comme méthodes de contact, un utilisateur peut notifier tous les services fantômes.

Configurez les règles de notification pour générer immédiatement un e-mail à tous les services fantômes correspondants.

Ajoutez l'utilisateur fantôme à votre politique d'escalade sur le compte principal

Vous disposez probablement d'un calendrier pour votre politique de remontée des gardes pour l'équipe « Labs » sur le compte PagerDuty principal. Ajoutez l'utilisateur fantôme à la politique d'escalade parallèlement à ce calendrier, afin que l'utilisateur fantôme soit averti, quelle que soit la personne de garde. Important : n'ajoutez pas l'utilisateur fantôme directement à la politique d'escalade. Cela signifie que les actions de cette personne peuvent interférer avec la gestion réelle de l'incident.

Tester la configuration

Ceci termine la configuration unique. Vous pouvez maintenant tester si elle fonctionne réellement.

Choisissez un service utilisé par l’équipe sur le compte principal et déclenchez manuellement un incident.

 

L'incident apparaîtra sur le compte principal.

 

Il apparaîtra également sur le compte fantôme, l'utilisateur de l'espace réservé étant paginé.

Reconnaissez et résolvez l'incident fantôme, et notez qu'aucune modification n'a été apportée à l'incident sur le compte principal. Parfait ! C'est ce que nous recherchions.

Configuration d'un utilisateur pour l'observation

Lorsqu'une personne souhaite effectuer une observation, invitez-la à rejoindre le compte Shadow. Demandez à l'utilisateur de configurer les méthodes de notification et les autres informations utilisateur comme d'habitude, puis définissez-les comme priorité dans le planning d'observation. Une fois la période d'observation terminée, supprimez l'utilisateur.

Notes de planification

Chez PagerDuty, disposer de services et d'horaires distincts pour l'observation nous permet de modifier les heures d'observation. Au lieu de suivre l'horaire de la primaire (qui est souvent de 24 heures sur 24, 7 jours sur 7), nous pouvons choisir d'alléger la charge d'observation en excluant les week-ends ou en limitant l'observation aux heures de bureau uniquement.

Il est plus facile d'exclure des jours spécifiques en utilisant la fonction « Limiter les périodes d'astreinte à des heures spécifiques ». Il est plus facile de configurer une surveillance uniquement pendant les heures ouvrables à partir d'un service de surveillance (par exemple, « Comment les intervenants doivent-ils être informés ? » et « Utiliser des heures de support définies »).

N'oubliez pas : lorsque vous mettez en place une pratique d'observation au sein de votre organisation, gardez à l'esprit que si l'ombre est ajoutée à la rotation d'astreinte, elle devient l'astre principal, et si l'ombre est ajoutée à la politique d'escalade, ses actions peuvent interférer avec la gestion des incidents.

Comment nous intégrons le shadowing dans notre culture

PagerDuty est transparent dans ses pratiques d'observation car nous voulons que tout le monde dans l'entreprise sache ce que fait PagerDuty . Nous encourageons chacun, quel que soit son poste au sein de l'entreprise, à passer une semaine suivre une équipe d'ingénieurs utiliser PagerDuty pour comprendre ce que fait notre produit et comment l'utiliser. Plusieurs de nos équipes avec une rotation d'astreinte hebdomadaire ont défini leur horaire d'observation par défaut pour exclure les week-ends et le jour où l'astreinte est transférée d'un ingénieur à l'autre, ce qui donne lieu à un travail de 4 jours par semaine, 24 heures sur 24. heures par jour « quart d’observation ».

La plupart de nos équipes laissent les nouveaux ingénieurs décider du moment où ils souhaitent commencer à faire de l'observation et du moment où ils se sentent prêts à rejoindre la rotation d'astreinte. Nous prévoyons que l'observation débutera au cours des trois premiers mois, et notre culture de responsabilité partagée et d'absence de reproches rend le passage de l'observation à l'astreinte moins intimidant.

Maintenant que vous savez comment mettre en place l'observation comme nous le faisons chez PagerDuty, nous vous encourageons à utiliser cette pratique essentielle pour de meilleures expériences de garde et une intégration plus fluide de vos ingénieurs.