Blog

PagerDuty Champions : favoriser l'excellence dans la gestion des incidents

par Constant Fischer 3 avril 2025 | 4 minutes de lecture

Comme l'a dit un client : « Nous passons 99 % de notre temps sur notre plateforme ITSM et seulement 1 % sur PagerDuty. »

Cette simple affirmation souligne la beauté de PagerDuty: c'est un outil facile à entretenir et performant. Cependant, même les meilleurs outils bénéficient d'une gouvernance minimale pour garantir leur efficacité. Entrez dans le Champions de PagerDuty —une petite équipe à temps partiel dédiée à maintenir vos pratiques de gestion des incidents à jour et à maintenir la productivité de vos équipes.

Pourquoi la gouvernance est importante pour PagerDuty

PagerDuty est conçu pour simplifier la gestion des incidents. Cependant, sans une supervision adéquate, même les meilleurs outils peuvent ne pas exploiter pleinement leur potentiel. La gouvernance garantit que les équipes utilisent efficacement les fonctionnalités de PagerDuty, évitent les inefficacités et améliorent continuellement leurs processus de réponse aux incidents.

La bonne nouvelle ? Cela ne nécessite pas de poste à temps plein. Deux champions PagerDuty , deux personnes se soutenant mutuellement, peuvent assumer cette responsabilité avec un minimum de temps, surtout après la phase d'intégration initiale. Leur mission ? Assurer le bon fonctionnement de PagerDuty et aider les équipes à progresser dans la gestion des incidents.

La liste de contrôle des champions PagerDuty

Pour maintenir un niveau élevé de gestion des incidents, les champions PagerDuty doivent se concentrer sur les tâches suivantes, idéalement sur une base trimestrielle (ou plus fréquemment si nécessaire) :

1. Calendriers d'audit et politiques d'escalade

  • Identifiez les utilisateurs inactifs dans les plannings ou les politiques d'escalade et incitez les équipes à les nettoyer.

2. Surveiller les indicateurs clés

  • MTTA (temps moyen de reconnaissance) et MTTR (temps moyen de résolution) : Assurez-vous que les incidents sont reconnus et résolus rapidement.
  • Volumes d'incidents anormaux :Un nombre élevé d’incidents peut indiquer une surveillance mal calibrée.
  • Événements entrants excessifs :Cela pourrait indiquer une surveillance mal configurée ou des API envoyant des données inutiles.
  • Incidents P1 fréquents ou grands groupes d'intervenants :Une réaction excessive aux incidents peut entraîner une perte de productivité et un épuisement professionnel.

3. Examiner les services aux entreprises

  • Assurez-vous que tous les services sont pertinents et correctement nommés. Évitez les lacunes ou les définitions de services vagues.

4. Fermer les incidents ouverts depuis longtemps

  • Les incidents qui persistent pendant plus d’une journée doivent être signalés et traités.

5. Promouvoir l'adoption des fonctionnalités

  • Faible utilisation de fonctionnalités telles que flux de travail des incidents , orchestration d'événements , ou actions d'automatisation Cela signifie que les équipes passent à côté d’opportunités de gagner du temps.
  • Encourager l’utilisation de ChatOps et notifications aux parties prenantes pour améliorer la communication lors d'incidents.

Au-delà des bases : favoriser la maturité et l'engagement

Les champions PagerDuty doivent également s'attacher à favoriser une culture d'amélioration continue. Voici comment :

  • Maintenir le code Terraform :Fournir des modèles Terraform réutilisables pour les services d'intégration et les règles d'orchestration, facilitant ainsi le démarrage des équipes.
  • Organiser des sessions régulières :Organisez des sessions pour présenter les nouvelles fonctionnalités de PagerDuty , partager les meilleures pratiques et mettre en valeur les équipes les plus matures.
  • Sécuriser le parrainage exécutif :Aidez les dirigeants à comprendre la valeur d’une gestion efficace des incidents et à obtenir leur soutien.
  • Partager des indicateurs et des informations :Partagez régulièrement des statistiques sur les tendances des incidents, les performances de l’équipe et la santé globale du système.
  • Promouvoir la certification : Encouragez les membres de l’équipe à obtenir les certifications PagerDuty et à maintenir une liste d’utilisateurs certifiés.

Combien de temps cela prend-il ?

L'avantage de la gouvernance PagerDuty réside dans son faible impact. Grâce aux processus adéquats, les champions PagerDuty peuvent avoir un impact considérable avec un investissement de temps minimal. Des outils comme Dans les coulisses Spotify peut aider à rationaliser la gouvernance de PagerDuty en centralisant la gestion des services et en garantissant l'alignement entre les équipes.

Les avantages de la gouvernance PagerDuty

Investir un peu de temps dans la gouvernance de PagerDuty peut apporter des avantages significatifs :

  • Productivité accrue :Les équipes passent moins de temps à éteindre les incendies et plus de temps à innover.
  • Meilleure qualité de service :Une résolution plus rapide des incidents conduit à une plus grande fiabilité.
  • Amélioration de la satisfaction client :Un processus de gestion des incidents plus fluide signifie des clients plus satisfaits.

Commencez petit, gagnez gros

Si vous ne savez pas par où commencer, privilégiez une approche simplifiée. Backstage peut simplifier la gouvernance de PagerDuty en fournissant une plateforme centralisée pour gérer les services, la documentation et la propriété, garantissant ainsi la cohésion et l'efficacité des équipes. Même des étapes simples, comme l'audit des plannings ou la promotion de l'adoption de nouvelles fonctionnalités, peuvent faire la différence. L'essentiel est de commencer quelque part et de développer une dynamique au fil du temps.

Appel à l'action

Prêt à améliorer vos pratiques PagerDuty ? Découvrez les meilleures pratiques et ressources disponibles sur university.pagerduty.com et response.pagerduty.com Avec un peu de gouvernance et les bons outils, vos équipes peuvent atteindre l’excellence en matière de gestion des incidents.

Faites le premier pas aujourd’hui : vos champions PagerDuty attendent de faire la différence !