- PagerDuty /
- Blog /
- Meilleures pratiques et informations /
- Page suivante !
Blog
Page suivante !
Qu'avez-vous fait pour améliorer la vie de vos collègues de garde ? a posé cette question à mes abonnés sur Twitter pour voir ce que les gens font pour rendre les choses aussi agréables que possible pour ceux qui gardent un œil vigilant sur nos systèmes critiques. Voici un petit échantillon de ce que j'ai appris.
Fournir un contexte
https://twitter.com/alimacio/status/940720141523763200
@alimac Ingénieur d'exploitation
Lorsque vous êtes confronté à un problème, la dernière chose que vous souhaitez faire est de rechercher des informations tribales. Devoir réinventer la roue à chaque panne fait perdre du temps et coûte de l'argent à l'organisation. Fournir un accès facile aux informations historiques permet de reproductibilité des correctifs/résolutions.
Une méthode pour aider à fournir un contexte aux personnes au milieu d'une fusillade est Capacité de regroupement d'alertes de PagerDuty , qui regroupe automatiquement les alertes liées en un seul incident enrichi pour réduire le bruit tout en centralisant le contexte. De même, si vous utilisez un outil comme Slack pour collecter vos informations pendant l'incident, Fonctionnalité Post-mortem de PagerDuty peut les ingérer dans le rapport.
Passez en revue toutes les choses
Nous parlons chaque jour de chaque alerte des 24 derniers jours. Aucune vitre cassée.
— Andy Fleener (@andyfleener) 13 décembre 2017
Andy Fleener Responsable des opérations de la plateforme, Moteur de sport
Si nous ne traitons pas chaque panne ou alerte comme une leçon à tirer ou une amélioration à apporter, nous courons le risque de voir la situation se détériorer. Normalisation de la déviance effet. Dans ce cas, nous commençons à accepter les alertes ou les dégradations comme acceptables. Nos standards en pâtissent. Nous laissons passer les choses.
Pour éviter cela, il est essentiel de tendre vers une culture de l’apprentissage. Selon Ron Westrum Dans une organisation générative et axée sur la performance, « l’échec mène à la réflexion ». Les échecs sont des occasions d’améliorer les choses, mais seulement si nous prenons le temps et l’effort d’en tirer des leçons.
Les indicateurs comptent
Depuis les ventes : définir les attentes.
— Eric Snyder (@esnyds) 13 décembre 2017
« Les ventes et la gestion des comptes sont souvent au cœur d’une escalade », a déclaré Éric Snyder, Directeur principal des chaînes chez Auth0 « Transmettre la sensibilité et le contexte à l’équipe d’astreinte est aussi important que de définir les attentes du client. Gérer les attentes et les communications des clients donne à l’équipe d’astreinte l’espace et le temps nécessaires pour mettre en place la solution. Une bonne pratique consiste pour les équipes de vente et de gestion de compte à connaître leurs propres équipes aussi bien qu’elles connaissent leurs clients. »
Assurons-nous que nous définissons les attentes appropriées. Nous ne voulons pas nous attendre à cinq 9 de fiabilité simplement parce que « cinq est mieux que quatre ». Pourquoi avez-vous besoin de cinq ? Avez-vous lié vos indicateurs à un résultat commercial ?
De même, vos mesures de vitesse ne doivent pas être « plus rapides que le mois dernier ». Et méfiez-vous des extrapolations inexactes. Vous disposez peut-être de données suggérant que si le temps de chargement de votre page augmente d'une seconde, la conversion chute de 50 %. Mais cela ne signifie pas que si vous réduisez le temps de chargement d'une seconde, la conversion augmentera augmenter de 50 pour cent. La corrélation n'est pas toujours synonyme de causalité, et les mêmes chiffres ne font pas bouger les cadrans dans les deux sens.
Les gens sont les gens
La totalité @cookieopsdotcom chose. C'est calmé mais nous avons fait cuire *beaucoup* de biscuits pour les gens des opérations
— chris corriere (@ecology_chris) 13 décembre 2017
Tout le monde a une motivation. Certaines personnes sont motivées par la reconnaissance. D'autres sont motivées par l'argent. Mais presque tout le monde a une motivation. tout le monde aime les biscuits ou autres friandises.
« Les meilleurs biscuits sont les cannoli de grand-mère, mais ils demandent beaucoup de travail », a déclaré Chris Corriere , ingénieur système chez Ecology Computing, qui fournit des services de modélisation, de cartographie et d'adaptation des systèmes. « Mais nous avons des pépites de chocolat sous clé et nous pouvons les produire en série. »
Vous n’avez pas besoin d’être un grand boulanger (mais je pense que tout le monde devrait essayer de faire Pete Cheslock Crinkle au chocolat Biscuits ). La clé est de montrer votre reconnaissance, et de le faire en faisant plus que simplement envoyer un message Slack ou offrir une carte Starbucks de 5 $. Cela montre que vous avez pris le temps de réfléchir et de comprendre que vos collègues ont assumé la grande responsabilité de veiller sur l'entreprise pour laquelle vous travaillez tous les deux, pendant les petites heures du matin. C'est le moins que vous puissiez faire.
Des politiques différentes pour les alertes de jour et de nuit afin que nous soyons moins réveillés pendant la nuit.
— Emma Sax (@emmahsax) 12 décembre 2017
Emma Sax , Ingénieur logiciel, Moteur de sport
De même, n'oubliez pas qu'il y a une personne à l'autre bout de cette alerte. Le contexte est important pour savoir quand et comment vous êtes alerté : pendant la journée, les choses peuvent avoir une criticité différente. Par exemple, l'application de grand livre de votre entreprise peut être utilisée uniquement par les employés basés aux États-Unis et uniquement pendant la journée de travail. Si le système ne répond pas pendant cette période, il s'agit d'une alerte de haute urgence et vous devez en être informé immédiatement ! Mais si elle échoue à 1 heure du matin, vaut-il la peine de faire sortir l'ingénieur de garde du lit ? Probablement pas.
Si vous utilisez PagerDuty, vous pouvez configurer l'urgence sur un service individuel en fonction des heures (ou d'autres critères comme les informations sur la charge utile). Compte tenu de l'exemple ci-dessus, pour le service de grand livre général, nous pourrions définir une urgence plus élevée pour les heures ouvrables et une urgence beaucoup plus faible pour les heures en dehors des heures ouvrables.
Alors, passons à la page suivante
Qu'est-ce qu'une chose toi Avez-vous fait quelque chose pour améliorer la vie de vos collègues de garde ? Faites-le nous savoir dans les commentaires ou sur Twitter @pagerduty avec le hashtag #pageitforward !