5 façons d'améliorer la santé de l'équipe grâce à des transferts d'astreinte efficaces
« Vous le codez, vous en êtes propriétaire ' signifie que les ingénieurs sont appelés lorsque les logiciels et les systèmes qu'ils ont créés échouent en production et qu'il est de leur responsabilité de tout faire fonctionner à nouveau. Cependant, les gestionnaires et intervenants commerciaux Les ingénieurs ne sont généralement pas de garde et ne ressentent donc pas la douleur d'être appelés. Cela peut conduire à des décisions de priorisation du travail qui manquent d'empathie et ne tiennent pas compte de la responsabilité que nous avons tous en matière de résilience opérationnelle. Les responsables insistent sur la livraison de nouvelles fonctionnalités et une productivité plus élevée plutôt que sur des tâches qui répondent aux difficultés opérationnelles. Les ingénieurs voient les problèmes et se sentent impuissants à les résoudre. Au fil du temps, ce conflit entraîne des pannes coûteuses qui nuisent à l'équipe, à l'entreprise et aux clients.
Les petits problèmes sont généralement un signe avant-coureur de problèmes plus graves. S'ils sont résolus dès qu'ils surviennent, des problèmes plus graves peuvent être évités à long terme et votre équipe et vos clients restent satisfaits.
Alors, comment pouvons-nous être proactifs et faire de la résolution des problèmes opérationnels une habitude ? Donner à l'équipe les moyens d'agir grâce à des sessions de transfert efficaces sur appel est un excellent point de départ !
Lorsque les membres de notre équipe de garde quittent leur service et passent le relais à leurs coéquipiers, nous profitons de ce temps pour exposer les problèmes opérationnels, discuter des solutions et permettre à l'équipe de lancer des actions. Voici quelques conseils pour des sessions de transfert d'astreinte efficaces, basés sur mon expérience d'astreinte dans un certain nombre d'entreprises, dont PagerDuty.
1. Faites des transferts d'astreinte un rituel
Il est facile de passer à côté des problèmes auxquels les ingénieurs sont confrontés lorsqu'ils sont de garde si l'équipe ne parle que de problèmes opérationnels dans les salles de discussion techniques. Nous organisons régulièrement des sessions de transfert dédiées pour encourager la réflexion et créer un biais en faveur d'une action proactive pour traiter la cause profonde. Nos horaires changent généralement une fois par semaine, de sorte que la réunion coïncide avec le jour du changement. La fréquence des transferts dépend généralement de la rapidité avec laquelle votre équipe réagit. horaire de rotation de garde change et peut varier selon l’organisation et l’équipe.
2. Augmentez l'empathie en invitant des non-ingénieurs
Être de garde et se réveiller face à des incidents peut être perturbant et stressant. Nous incluons d'autres parties prenantes dans la réunion de transfert de garde pour créer un sentiment de camaraderie et empathie , ce qui conduit finalement à une meilleure prise de décision dans l’ensemble de l’organisation.
Notre chefs de produits Les PM peuvent tirer profit de la compréhension de l'impact des difficultés opérationnelles sur les ingénieurs et les clients. L'exposition aux sessions de transfert permet aux PM d'entendre l'impact de leurs décisions de priorisation et de s'assurer que les initiatives techniques et de produits progressent pendant les sessions de planification du travail.
L'objectif de dirigeants en ingénierie est de favoriser une culture d'équipe Un environnement dans lequel les individus sont heureux, motivés, créatifs et engagés. En observant les séances de transfert de tâches sur appel et en écoutant attentivement les préoccupations, les responsables du personnel sont exposés à des informations qui peuvent ne pas être découvertes lors des réunions d'équipe ou individuelles. Après la session, les dirigeants peuvent prendre des mesures pour fournir un soutien et des ressources. Encourager les ingénieurs à prendre des congés bien mérités ou aider à prioriser les recommandations techniques/opérationnelles de l'équipe en sont deux exemples.
3. Adoptez l'observabilité en examinant les indicateurs pendant le transfert
Les équipes ont tendance à s'habituer aux perturbations lorsqu'elles s'accumulent progressivement au fil du temps, surtout si personne n'adopte une vision globale et ne remarque les tendances inquiétantes. En examinant les indicateurs lors de la séance de transfert, on favorise une culture d'observabilité qui permet à l'équipe d'avoir une vision réelle de la santé opérationnelle, à la fois de la santé des infrastructures et de la santé humaine.
Voici les mesures et les outils que nous avons trouvés utiles lors de nos séances de transfert :
Statistiques sur les perturbations d'équipe : PagerDuty fournit des données et des graphiques précieux montrant le nombre total d'incidents par service, équipe et utilisateur. La comparaison des chiffres à chaque examen nous permet de réfléchir aux tendances et de discuter des solutions.
Historique des discussions :En utilisant l'intégration du chat ( Mou , Hipchat etc.), toutes les notifications d'incident peuvent être envoyées vers un canal dédié. Nos ingénieurs discutent dans le même canal que les notifications d'incident, ce qui facilite l'identification et l'analyse des fils de conversation présentant les sujets et préoccupations les plus en vogue.
Utilisez les API publiques de PagerDuty pour créer des rapports et des applications personnalisés : En utilisant API de PagerDuty prend en charge la création de rapports et d'applications qui peuvent être personnalisés en fonction de votre entreprise. Par exemple, nous avons créé une extension qui donne une image instantanée du niveau de perturbations subies par les membres de l'équipe d'astreinte en dehors des heures de travail, en fonction de l'heure de la journée et de la fréquence des incidents prioritaires. En partageant cette vue avec l'ensemble de l'équipe lors de la session de transfert, nous obtenons une image de la santé de l'équipe qui nous motive à agir.
4. Agissez pour vous améliorer
Créez des tâches, expérimentez, révisez et ajustez
Les sujets de préoccupation mis au jour lors des séances de transfert d’astreinte doivent être suivis d’actions concrètes. Intégration Jira de PagerDuty permet de suivre rapidement et facilement les tâches non planifiées directement depuis le début d'un incident. Il suffit ensuite d'une simple étape pour attribuer ces tâches à l'ingénieur d'astreinte (voir la section suivante « Renforcer les attentes concernant les tâches d'astreinte » pour comprendre comment cela fonctionne).
Si des améliorations sont constatées et corrélées à des actions concrètes, il est beaucoup plus probable que ces améliorations se produisent.
N'oubliez pas de revoir le résultat des changements lors des séances de transfert de service ultérieures et d'ajuster votre approche en fonction de ce que vous avez appris.
5. Renforcer les attentes en matière de bonnes pratiques de permanence téléphonique
De nombreuses équipes tombent dans le piège de ne pas définir clairement les attentes en matière d'astreinte et considèrent cette activité comme faisant simplement partie du travail plutôt que comme un rôle dédié et essentiel. Comment éviter ce piège ? Nous définissons des attentes claires :
- Durant leur quart de travail d'astreinte, les ingénieurs consacreront du temps à rechercher et à résoudre en priorité la cause profonde des problèmes opérationnels.
- Choisir de nouveaux projets devrait être un luxe, pas une attente.
- Après une nuit ou un week-end perturbé, les ingénieurs de garde sont censés faire une pause et avoir le temps de récupérer.
Lors de la séance de passation de service, il est important de vérifier ces attentes et de renforcer le message : L’amélioration opérationnelle nécessite des efforts : les humains ont besoin de temps et d’espace pour pouvoir s’y concentrer. Ils ont également besoin de temps d’arrêt et d’une charge de travail soutenable.
Pour plus de conseils sur les meilleures pratiques en matière de permanence, consultez notre Guide de survie sur appel.
Avoir des ingénieurs sur appel est un moyen efficace d'encourager l'amélioration continue et la stabilité du système. Cependant, cela ne fonctionne que si tous les membres de l'organisation comprennent comment jouer leur rôle pour assurer le succès de cette opération. Même si vous n'êtes pas ingénieur, vos décisions sont susceptibles d'avoir des effets secondaires imprévus sur le bien-être des ingénieurs et des systèmes qu'ils construisent. S'impliquer dans les sessions de transfert sur appel et encourager la résolution proactive des problèmes conduit à des équipes heureuses et à des produits performants. Je vous encourage à examiner votre propre organisation et à réfléchir aux moyens par lesquels vous pouvez développer l'empathie au sein des équipes en utilisant des techniques similaires. Partagez vos idées et suggestions dans notre Forum de la communauté !