Blog

Le pouvoir des revues opérationnelles

par Morgan Dornbush 20 février 2019 | 4 minutes de lecture

L'automne dernier, nous avons présenté Analyses de PagerDuty , un produit qui combine les données de réponse des machines et des humains pour fournir des informations opérationnelles qui permettent aux organisations de développer la maturité des processus et d'améliorer les résultats commerciaux. Aujourd'hui, nous sommes ravis d'annoncer qu'il est disponible partout ! Dans le cadre de notre offre étendue de produits Analytics, nous déployons un ensemble de tableaux de bord de performance opérationnelle prescriptifs.

Avant de créer ces tableaux de bord, nous avons observé et interrogé de nombreuses organisations performantes sur leurs meilleures pratiques en matière d'amélioration des processus et avons étudié en profondeur leurs indicateurs. À l'aide de ces informations, nous avons créé des tableaux de bord basés sur la structure de vos équipes, services et organisation dans PagerDuty.

Notre objectif était d'imiter les processus naturels, d'encourager les meilleures pratiques et de suivre les rituels des équipes qui évoluent déjà vers une mentalité DevOps ou qui opèrent dans ce sens afin de pouvoir aider les équipes à mieux collaborer pour résoudre des problèmes plus importants. Utilisez ces fiches d'évaluation lors des revues opérationnelles régulières avec vos équipes et vos parties prenantes pour vous aider à avoir des conversations plus significatives et plus percutantes.

Pourquoi utiliser les revues opérationnelles ?

Il y a de nombreux avantages à avoir un « Vous le construisez, vous en êtes propriétaire » La culture DevOps, qui inclut une livraison de logiciels plus rapide et plus fréquente, ainsi que la responsabilisation, puisque chaque développeur est propriétaire de son code et est responsable de sa correction en cas de problème. Mais il existe également un risque très réel de surcharger les équipes, ce qui peut les amener à prendre des décisions opérationnelles moins qu'idéales pour obtenir des résultats immédiats au lieu d'investir dans l'évolutivité et la stabilité à long terme.

De toute évidence, cela n’est pas souhaitable et devrait être évité. L’une des meilleures façons pour les équipes d’améliorer la prise de décision est de procéder à des évaluations opérationnelles régulières. Au fil des conversations avec nos clients, nous avons appris que des évaluations opérationnelles efficaces ne se limitent pas à la recherche et à l’affichage de données. Elles aident également les équipes à prendre des décisions éclairées, éclairées et (souvent) avisées concernant les meilleures pratiques de gestion des services modernes.

Ces évaluations doivent fournir des informations pertinentes non seulement sur les outils et services créés et utilisés, mais également sur les comportements des équipes. Les responsables peuvent également utiliser ces évaluations pour découvrir des tâches imprévues et/ou une charge opérationnelle inutile à laquelle une équipe peut être confrontée.

Nous avons également appris que l’une des fonctionnalités les plus précieuses de toute solution d’analyse devrait être de permettre aux équipes et aux parties prenantes d’avoir des analyses opérationnelles plus efficaces au sein de l’organisation. documentation des revues opérationnelles open source vous aidera, vous et votre équipe, à mieux comprendre la santé globale de votre équipe, la durabilité et la fiabilité de votre service, ainsi que son impact sur l'entreprise, permettant à votre équipe de disposer des informations dont elle a besoin pour améliorer en permanence sa maturité opérationnelle.

Fiches d'évaluation opérationnelle

Nous pensons qu’une discussion sur ce qui s’est bien passé et ce qui pourrait être amélioré devrait être prévue à la fin de chaque rotation afin que les intervenants soient conscients des problèmes potentiels tels que « Quel service a été le plus problématique ? » et « Quelle alerte a réveillé les gens pendant la nuit ? »

Notre Tableau de bord du rapport de transfert d'appel aide le prochain rotation sur appel déterminer sur quoi ils souhaitent se concentrer. De plus, le passage à ce modèle proactif aidera les équipes à réagir plus rapidement en cas d'incident, car elles disposeront des informations nécessaires pour prendre des décisions plus éclairées en moins de temps.

La fiche d'évaluation a été conçue pour vous aider à améliorer l'efficacité de votre équipe et doit être utilisée lors de l'évaluation opérationnelle hebdomadaire. La fiche d'évaluation affiche un résumé de plusieurs indicateurs, notamment :

  • Tous les transferts qui ont eu lieu au cours de la semaine
  • Mesures des intervenants individuels
  • Nombre d'interruptions
  • Nombre d'interruptions de sommeil

En plus des examens de transfert sur appel, nous souhaitons également nous concentrer sur la les équipes de services techniques construisent, possèdent et surveillent Les services techniques sont les éléments de base de votre écosystème de surveillance PagerDuty , et les équipes les utilisent pour détecter et résoudre rapidement les problèmes d'infrastructure. En raison de l'importance de ces services, nous encourageons les équipes à s'asseoir et à examiner les performances de tous les services. Cependant, nous voyons souvent des équipes ignorer les notifications des services bruyants, car le nombre d'alertes reçues est si élevé qu'il faut tout simplement trop de temps pour les résoudre. séparer les alertes exploitables du bruit et il est plus facile de les ignorer que de les aborder.

C'est ici que notre Fiches d'évaluation des opérations de service interviennent. Ils fournissent des vues détaillées sur l'état et la fiabilité du service technique, avec des mesures telles que le temps d'arrêt total, le décalage des performances et le MTTR, pour vous aider, vous et votre équipe, à trouver les domaines sur lesquels vous souhaiterez peut-être vous concentrer pour éviter des problèmes majeurs.

Puissance de PagerDuty Analytics + Visibilité PagerDuty

Associé à Visibilité de PagerDuty — qui fournit une vue holistique des données de la machine, des services, des équipes, des actions correspondantes et de l'impact commercial de la réponse aux incidents — les fiches d'évaluation opérationnelles aident votre équipe à coordonner efficacement les efforts de réponse communiquer avec les parties prenantes sur le temps nécessaire à votre équipe pour résoudre les problèmes imprévus, ainsi que sur le temps et le travail nécessaires pour résoudre les incidents majeurs.

Vous souhaitez voir les tableaux de bord de votre équipe ? Contactez-nous pour vous inscrire à un essai gratuit !