Le côté humain de la permanence : 5 leçons pour gérer le stress, l'anxiété et la vie pendant la permanence
Dans le domaine DevOps, on parle beaucoup du processus d’astreinte, mais qu’en est-il de l’aspect humain de cette astreinte ? Par exemple, quels sont les moyens efficaces de gérer le stress et l’anxiété pendant un quart de travail ? Comment gérer les situations de la vie qui rendent l’astreinte difficile, comme la responsabilité de surveiller les enfants pendant une rotation d’astreinte ? Et comment une culture d’équipe empathique peut-elle aider à prévenir l’épuisement professionnel et le turnover ?
En novembre et décembre 2021, les ingénieurs d'astreinte de neuf équipes de PagerDuty se sont réunis pour discuter de l'aspect humain de l'astreinte. Voici les cinq points clés à retenir de ces sessions :
- L’empathie au sein de l’équipe est essentielle
- Ne regardez pas les graphiques toute la journée
- Les autopsies peuvent être stressantes et demander beaucoup de travail
- Les alertes de faible urgence réduisent le bruit nocturne
- Une semaine de garde peut conduire à l'épuisement professionnel
Avant de plonger dans chaque point clé à retenir, examinons certaines mesures liées aux équipes avec lesquelles nous avons discuté.
En chiffres
Voici les principaux points de données concernant les équipes qui ont participé aux sessions « côté humain des astreintes » :
- Quelle est la taille de votre rotation d'astreinte ? La taille moyenne de la rotation d'astreinte était de 5 ingénieurs.
- Avez-vous un auxiliaire de garde ? 60 % des équipes ont répondu « oui ».
- À quelle fréquence êtes-vous de garde ? La fréquence moyenne d’astreinte était de 3,5 semaines.
- Quelle est la durée de votre permanence ? La durée moyenne des quarts de travail était d'une semaine, plusieurs équipes la répartissant en jours de semaine/week-ends.
- Combien de temps passez-vous de garde par semaine (médiane) ? La durée moyenne des astreintes hebdomadaires était de 4 heures. Pour deux des neuf équipes, l'ingénieur d'astreinte consacrait la majeure partie de ses heures de travail à résoudre des problèmes d'astreinte.
Nous avons représenté les heures passées en astreinte dans cet histogramme. Comme vous pouvez le constater, 55 % des équipes interrogées ont passé 0 à 5 heures par semaine en astreinte, 22 % des équipes ont passé 5 à 10 heures en astreinte, 11 % ont passé 30 à 35 heures en astreinte et 11 % ont passé 40 heures en astreinte :
Histogramme : Heures passées en astreinte par équipe
Maintenant que nous avons partagé certains détails autour de notre groupe de discussion, plongeons dans chaque leçon plus en détail.
Leçon 1 : L’empathie au sein de l’équipe est essentielle
La culture d’équipe est primordiale : elle pose les bases d’un espace sûr. Mettre en place des normes qui renforcent (par des mots et des actes) le fait qu’il est acceptable de demander des dérogations pendant votre semaine d’astreinte est un élément essentiel pour donner le ton à l’expérience d’astreinte de votre équipe. Le changement culturel ne se produit pas du jour au lendemain, mais il peut être développé et façonné au fil du temps. Pendant que ce changement culturel se produit au sein de votre équipe, il est important de l’encourager activement dans le cadre de la culture d’équipe de la manière la plus logique pour l’équipe. Par exemple, après avoir demandé une dérogation, vous pouvez remercier votre collègue lors d’une rétrospective d’équipe pour susciter un renforcement positif. Si votre équipe a documenté ses normes, vous pouvez également suggérer d’y ajouter « il est acceptable de demander des dérogations ». De plus, en tant que pair ou responsable, il est important de vérifier comment se porte l’ingénieur d’astreinte, en particulier après des incidents majeurs. Cela est particulièrement vrai s’il s’agit du premier incident majeur d’une personne.
Le plus important est peut-être que l'équipe et le responsable doivent faire preuve d'empathie envers la situation de vie unique de chaque ingénieur d'astreinte. Par exemple, avoir des animaux de compagnie, des enfants ou des parents âgés peut rendre la gestion des astreintes plus difficile. De plus, être confronté à un événement stressant, comme le décès d'un proche, peut aggraver le stress ressenti pendant l'astreinte. Dans ces situations, il est important d'être proactif et de suggérer à un ingénieur qu'il ne devrait peut-être pas être d'astreinte pendant une période particulièrement difficile.
Leçon 2 : Ne regardez pas les graphiques toute la journée
Il est important de garder à l'esprit qu'être de garde ne signifie pas que vous devez tout surveiller toute la journée. Vous devez avoir confiance dans le système et savoir que vous serez averti en cas de problème. Vous devez laisser tomber ce que vous ne pouvez pas contrôler et être vigilant sur ce que vous pouvez contrôler. Comptez sur une réunion d'évaluation des opérations de l'équipe pour effectuer un transfert entre les rotations afin d'être prêt pour votre quart de travail. Et n'oubliez pas que les incidents de faible urgence n'ont pas besoin de notifications push : vous n'avez pas besoin d'augmenter votre niveau de stress à ce sujet.
Lorsque vous avez du temps libre pendant votre rotation d'astreinte, concentrez vos efforts sur l'amélioration de la situation d'astreinte pour le prochain ingénieur d'astreinte. Par exemple, s'il y a un problème particulier qui se produit sans cesse (par exemple, des disques qui se remplissent, des journaux qui doivent être mis en rotation, des alertes bruyantes), attaquez-vous à une tâche qui le résout à long terme.
Leçon 3 : Les autopsies peuvent être stressantes et demander beaucoup de travail
Les incidents majeurs, qui nécessitent une réponse coordonnée entre plusieurs équipes, peuvent être très stressants, et la charge de travail supplémentaire des autopsies peut provoquer encore plus de stress. C'est une chose de gérer l'incident lui-même, mais c'en est une autre de devoir subir une semaine de stress supplémentaire après l'incident. Si les ressources le permettent, il peut être utile de créer un accord de travail pour que l'autopsie soit réalisée par quelqu'un d'autre autre que Le premier intervenant sur l’incident. De plus, il peut être utile de reconnaître le stress encouru et de prévoir un temps de décompression une fois l’incident résolu. Cela peut signifier donner à l’ingénieur de garde une période de « récupération » pendant laquelle il aura plus de flexibilité dans son horaire de travail et la possibilité de rattraper son retard dans d’autres domaines de sa vie.
Leçon 4 : Les alertes de faible urgence réduisent le bruit nocturne
Lorsqu'il n'y a pas de danger immédiat, une alerte peut être configurée comme étant de faible urgence pour garantir que l'ingénieur de garde ne soit pas appelé pendant son sommeil. Pour que cela fonctionne efficacement, l'équipe doit associer la configuration des alertes de faible urgence à l'intégration des ingénieurs de garde, afin que leurs paramètres d'alerte garantissent qu'ils ne sont pas perturbés par des alertes de faible urgence. L'intégration efficace des ingénieurs de garde doit expliquer comment configurer les paramètres de notification des utilisateurs, servant de point de contrôle pour s'assurer que les paramètres d'un nouvel employé sont corrects avant qu'il ne soit mis en rotation dans PagerDuty.
Leçon 5 : Une semaine de permanence peut conduire à l’épuisement professionnel
Être de garde pendant une semaine entière peut être une corvée mentale, car vous n'êtes pas complètement hors service pendant toute la semaine. Cela est vrai même si vous n'êtes pas appelé pendant votre quart de travail, car vous vous attendez toujours à être appelé. Trouver la durée idéale de rotation de garde est délicat, cela dépend de plusieurs facteurs, notamment :
- Les préférences des ingénieurs d'astreinte de l'équipe. Cela peut être évalué au moyen d'une enquête envoyée à l'équipe pour recueillir leurs avis sur la planification des astreintes.
- Comment les ingénieurs d'astreinte se sentent après avoir terminé leur service. Cela peut être suivi au fil du temps à l'aide d'une « note d'évaluation Yelp » de fin de service de 1 (pire) à 5 (meilleur).
- Le niveau de bruit des services de l'équipe. Plus de bruit signifie plus de stress, auquel cas une rotation d'astreinte plus courte serait préférable.
Au lieu d'être de garde pendant une semaine, d'autres options à considérer incluent les rotations en semaine/week-end, les rotations en heures ouvrables/après les heures ouvrables ou des quarts de travail plus courts de 2 jours, 2 jours, 3 jours par semaine.
Bonnes pratiques pour les équipes d'astreinte
Être de garde peut être stressant, mais avoir une culture d'équipe empathique et horaire de rotation de garde La méthode la plus adaptée aux préférences de l'équipe contribue grandement à réduire l'épuisement professionnel. Vous souhaitez en savoir plus sur les meilleures pratiques d'astreinte et sur la manière de développer une culture d'équipe empathique ? Consultez notre Bonnes pratiques pour les équipes d'astreinte guide.
Crédits
- Un grand merci à Amy Wood, Ashwin Jiwane, Charlotte Sarfati, Chelsea Vandermeer, Hunter Watson, Japa Swadia, Katherine ChengLi, KP Singh, Liam Stewart, Marcos Wright-Kuhns, Mandi Walls, Possum Nuada, Quintessence Anx, Roma Shah, Russ Smith, Todd Whitney, Tom Graft et Vivian Chan pour vos contributions à ces discussions et à cet article de blog.