Blog

Des praticiens expliquent comment ils éliminent la peur des astreintes

par Xenda Amici 3 janvier 2024 | 4 minutes de lecture

Être de garde n'est pas forcément l'aspect le plus agréable d'un travail. En fait, les équipes d'ingénierie peuvent ressentir un certain niveau de stress et de peur à l'idée d'être de garde : peut-être qu'une page sera manquée, ou peut-être qu'une page arrivera à 2 heures du matin et nécessitera de résoudre un problème de production pendant des heures.

Même lorsque l'équipe suit les guides des meilleures pratiques (consultez le site de PagerDuty) Propriété à service complet et Bonnes pratiques pour les équipes d'astreinte ), chaque professionnel peut créer ses propres mécanismes pour faire face aux inconnues de la gestion des incidents. Nous avons demandé aux membres de la communauté PagerDuty ce qu'ils font pour éliminer la peur d'être de garde et leur avons également demandé de partager un conseil pour ceux qui débutent dans la rotation de garde et voici quelques-uns de leurs conseils judicieux !

Qu’avez-vous fait pour éliminer la peur d’être de garde dans votre organisation ?

« Nous encourageons la pratique de la création de manuels de jeu pour chaque équipe. Un bon manuel de jeu n'a pas besoin de contenir toutes les réponses. Cependant, un bon manuel de jeu doit contenir, au moins, les éléments suivants : Comment s'appellent les services pris en charge par l'équipe ? Où se trouvent les services (git/deploy zone/links) ? Qui dans l'équipe est l'expert en la matière pour chaque service ? Comment savoir s'il est en cours d'exécution ou non (liens vers les moniteurs) ? Enfin, toute erreur constatée dans le passé et comment elle a été corrigée. » – John Miller, ingénieur logiciel

« Le temps et l’expérience permettent de dissiper cette peur dans une certaine mesure. Connaissez les responsabilités et les autres appels des autres services. » – Ehsan Ebrahimian, ingénieur du centre opérationnel national

« Autonomisation pour résoudre et prévenir l’incident à l’avenir. » – David Heinz, Responsable SRE

« Il est temps de régler le problème, pas de le fuir. » – Akhil Agarwal, ingénieur logiciel

« Nous encourageons la personne d'astreinte à prendre ses responsabilités et à gérer les incidents. Elle sait bien sûr que l'équipe est là pour l'aider en cas de besoin. » – Kamal Chhajed, ingénieur DevOps

Quel conseil donneriez-vous à quelqu’un qui se rend en permanence sur appel pour la première fois ?

« Vous n'êtes pas seul, vous n'êtes pas responsable de tout savoir et vous pouvez le faire. Vous êtes le point de contact lorsque le contact est nécessaire. Vous avez les connaissances de l'équipe (espérons-le !) dans les manuels. Si vous n'avez pas les réponses, appelez un expert en la matière. » – John Miller, ingénieur logiciel

« Tous ceux qui sont de garde ont déjà eu une première garde 🙂 Si vous travaillez en équipe, vous ne serez pas seul dans les airs et quelqu’un vous suivra. » – Ehsan Ebrahimian, ingénieur du centre opérationnel national

« Documentez, documentez, documentez ! La documentation est essentielle. Si les personnes qui interviennent sur appel savent quoi faire à chaque alerte qu’elles reçoivent et comment obtenir de l’aide lorsqu’elles en ont besoin, cela soulagera beaucoup de stress. » – Nathaniel Swanson Ingénieur du Centre opérationnel national

« Travailler avec les gens pour affiner les seuils de surveillance/d'observabilité qui les concernent. Lorsqu'ils ont participé activement à la détermination des moments où quelque chose qui les intéresse les atteindra, ils semblent moins sur la défensive lorsqu'il s'agit de discuter de la couverture d'astreinte. » – Administrateur d'observabilité JS

Vous recherchez une analyse approfondie des ressources d’opérations en temps réel ? Guides d'opérations de PagerDuty est la prochaine étape. Ces meilleures pratiques sont compilées à partir d'une utilisation pratique, de recherches et d'expériences. Découvrez Bonnes pratiques pour les équipes d'astreinte et découvrez ce qu'il faut pour commencer à mettre en œuvre une culture d'astreinte plus saine. L'équipe Dev Advocacy de PagerDuty les met fréquemment à jour et sollicite des contributions. Les opérations en temps réel sont la pratique consistant à répondre rapidement et efficacement aux événements numériques qui nécessitent une réponse humaine coordonnée.

Les cours et certificats de PagerDuty University sont également votre source de leadership intellectuel et d'apprentissage continu. Nous vous suggérons ici Rapports de disponibilité sur appel Cours. Découvrez la gamme complète des options ici : https://university.pagerduty.com/ .

Vous débutez votre service de garde ? Rendez-vous sur le Playlist YouTube de la communauté PagerDuty et laissez-vous inspirer par les brillantes séances de discussion des Developer Advocates :

Un grand merci à nos incroyables membres de la communauté PagerDuty qui ont partagé leurs expériences uniques avec nous : John, Ehsan, David, Akhil, Kamal, Nathaniel et JS. Nous voulons aussi vous entendre ! Rejoignez-nous dans le Forums communautaires !