Blog

Rendre le travail de garde aussi simple que possible

par Jérémy Bourque 5 avril 2017 | 4 minutes de lecture

Conçu pour le développeur

Le rôle du développeur de logiciels évolue rapidement. En tant que développeur, vous savez déjà que votre implication ne s'arrête pas lorsque vous déployez un service en production. Elle s'étend désormais à gérer ce service et être disponible pour répondre aux problèmes de production dès qu'ils surviennent.

C'est une grande responsabilité. La première fois que vous êtes intervenu, vous vous êtes peut-être senti inquiet et incertain. Et si quelque chose se cassait ? Et si je n'arrivais pas à le réparer ? Finalement, quelque chose s'est cassé et vous l'avez réparé. Et c'était génial !

Le travail d'astreinte peut être un peu effrayant, du moins au début. Mais c'est aussi gratifiant. C'est gratifiant non seulement parce que c'est agréable de vraiment résoudre un problème, surtout quand il n'a même pas encore eu d'impact sur vos clients, mais aussi parce que cela vous rend meilleur dans ce que vous faites. Cela signifie que vous êtes propriétaire de l'expérience client et cela vous aide à développer de l'empathie avec votre client. Cela vous aide également à développer de l'empathie avec vous-même, ou plutôt, avec votre futur moi qui finira un jour par loucher sur un tableau de bord de santé de service à 3 heures du matin et essayer de comprendre ce qui se passe.

Il n'est pas possible d'acquérir une expérience directe avec une simple formation. C'est grâce à cette expérience directe que vous apprenez à créer des services plus résilients, plus évolutifs, plus faciles à gérer et qui vous indiquent ce qui ne va pas lorsque quelque chose tombe en panne. Et c'est vraiment gratifiant.

Capacités spécifiquement destinées aux développeurs

Chez PagerDuty, nous avons développé de nouvelles fonctionnalités et API pour rendre l'astreinte aussi simple que possible, afin que vous puissiez bénéficier des avantages de l'expérience d'astreinte sans les soucis et l'incertitude qui l'accompagnent parfois.

Les premières choses que vous devez savoir sont (a) quand vous êtes de garde et (b) pour quels services vous êtes de garde. Avec On-Call Timeline, c'est plus facile que jamais. La chronologie visuelle montre vos quarts de travail de garde avec une liste détaillée des politiques et niveaux d'escalade pour chacun. L'indicateur pratique « maintenant » permet de voir facilement quand votre quart de travail actuel se termine ou quand votre prochain quart de travail commence.

L'un des principaux avantages de PagerDuty est qu'il rassemble les événements de tous vos différents systèmes de surveillance et fournit des outils puissants pour vous aider à exploiter ces données d'événements. Avec le nouveau API d'événements v2 vous pouvez facilement intégrer vos systèmes de surveillance et normaliser les données d'événements dans le Format d'événement commun PagerDuty (PD-CEF) Cela vous permet d'afficher les détails des alertes dans PagerDuty dans un format cohérent sans vous soucier des différents noms que les outils de surveillance utilisent pour les mêmes champs.

Le Console de commande des opérations vous aide à visualiser vos données d'alerte. Vous pouvez l'utiliser pour identifier rapidement les services bruyants, puis utiliser la suppression pour éviter d'être averti des événements non exploitables. Lorsque vous êtes averti pour quelque chose d'exploitable, l' Application de santé des infrastructures vous permet de visualiser instantanément le « rayon d'explosion » du problème pour voir si le problème est localisé ou généralisé.

Lorsque vous avez besoin d'une vue détaillée, Recherche d'alerte vous permet de personnaliser votre vue du tableau Alertes et de trouver rapidement les informations pertinentes à l'aide de champs normalisés, ce qui est essentiel pour minimiser la charge cognitive. Vous pouvez ajouter les colonnes que vous souhaitez et supprimer celles que vous ne souhaitez pas. Vous pouvez ensuite rechercher, filtrer et trier les colonnes pour trouver rapidement ce que vous cherchez.

Avec le amélioré API de création d'incident , vous pouvez automatiser le processus de création d'un nouvel incident pour représenter le problème sous-jacent que vous devez résoudre. Vous pouvez ensuite utiliser le API de fusion des incidents pour fusionner les alertes pertinentes qui décrivent les symptômes du problème dans l'incident qui représente le problème dans son ensemble. Cela vous permet de concentrer votre réponse autour d'un incident dans PagerDuty contenant toutes les alertes pertinentes pour fournir un contexte à l'équipe d'intervention et un enregistrement unifié de la réponse pour faciliter l'analyse ultérieure et l'autopsie.

Nous proposons également bien plus que de simples workflows de résolution pour vos alertes de surveillance. Étant donné que des problèmes peuvent survenir où que vous soyez, nous proposons désormais la création manuelle d'incidents à partir de l'application mobile PagerDuty .

Vous n'êtes peut-être pas disponible mais vous venez de remarquer un problème avec votre processus de paiement. Ou votre fournisseur de services vient de vous informer qu'il y a un problème urgent avec votre compte. Créez un incident avec l'application mobile et lancez la réponse immédiatement.

PagerDuty aide les développeurs à réussir

Chez PagerDuty, nous savons ce que signifie être de garde, nous le sommes aussi. C'est pourquoi nous nous engageons à fournir la meilleure solution disponible soutenir les développeurs sur appel. Ces nouvelles améliorations et fonctionnalités font partie de cet engagement. Elles ont déjà amélioré notre expérience d'astreinte et nous sommes désormais ravis de les mettre à votre disposition.