Blog

Nouvelles mises à jour des analyses avancées

par Sam Lewis 23 juillet 2015 | 1 min de lecture

Advanced Analytics s'appelle désormais Advanced Reporting, qui comprend les rapports d'équipe, de système et d'utilisateur. PagerDuty Analytics est un nouveau produit qui présente les informations opérationnelles les plus critiques au fil du temps sur vos collaborateurs, votre technologie et vos processus. Pour en savoir plus, visitez Analyse PagerDuty .


csv-hero

Découvrez les tendances en matière d'incidents et améliorez vos résultats

Si vous êtes comme la plupart des équipes d'opérations informatiques, vous avez probablement remarqué que vous êtes désormais confronté à plus d'incidents que jamais. PagerDuty vous aide à gérer et à résoudre ces incidents tout au long de leur cycle de vie, y compris l'étape critique « regarder en arrière et apprendre » une fois les problèmes résolus. L’analyse des tendances des incidents est une étape clé de la gestion des incidents. Il peut vous aider à réduire les alertes non exploitables qui provoquent l'épuisement professionnel et à identifier les alertes courantes qui sont des indicateurs avancés de problèmes plus importants.

Nous avons lancé Analyse avancée l'année dernière pour donner aux équipes un aperçu de haut niveau du système et rendement de l'équipe . Aujourd'hui, nous sommes heureux d'annoncer des améliorations apportées à nos fonctionnalités de reporting qui permettent aux équipes d'obtenir une visibilité encore plus grande. Désormais, les équipes peuvent optimiser leur surveillance en visualisant des indicateurs tels que les incidents courants, les performances des SLA et les incidents bruyants.

Tendances des incidents déclenchés

L'analyse du nombre d'incidents au fil du temps peut donner une idée rapide des points chauds. Cependant, les équipes ont besoin de rapports plus détaillés pour faire ressortir des informations exploitables qui entraînent des améliorations significatives de leur disponibilité et de leur efficacité. Nous avons capturé quelques rapports personnalisables que notre nouvelle fonction d'exportation vous permet de créer. Les équipes Top Operations ont un processus hebdomadaire au cours duquel elles examinent des mesures comme celles-ci et discutent des implications avec l'équipe.

Incidents les plus courants : Les équipes opérationnelles doivent savoir quels sont les incidents les plus courants. Vous pouvez désormais obtenir un aperçu rapide de ces incidents pour alimenter des discussions plus approfondies sur les problèmes récurrents.

Charge d'incidents par heure de la journée et jour de la semaine : Les alertes trop nombreuses peuvent épuiser votre équipe, surtout si elles interrompent le sommeil. Obtenez un aperçu instantané du moment où vos alertes sont déclenchées et voyez combien d'alertes réveillent l'équipe au milieu de la nuit.

Classification des incidents : Vous pouvez créer des classifications personnalisées pour les incidents et trier les incidents en fonction de ces classifications pour analyser les indicateurs clés. Par exemple, vous souhaitez voir votre temps de réponse pour les incidents critiques de Nagios par rapport aux alertes d'avertissement uniquement ? C'est possible.

Incidents bruyants : Le rapport système vous permet de voir quels services génèrent le plus d'alertes, mais la plupart des bruits proviennent d'alertes qui se résolvent rapidement et automatiquement. Notre nouvelle fonctionnalité de création de rapports vous permettra de voir ces incidents en un coup d'œil.

Tendances des réponses

En plus de comprendre les tendances des incidents déclenchés, nos mises à jour de rapports vous aident également à comprendre les tendances de vos réponses. Nous vous recommandons d'utiliser ces mesures pour irréprochable rétrospectives au sein de l'équipe sur les améliorations utiles des processus.

Incidents manqués : Obtenez un aperçu rapide des incidents qui ont été automatiquement escaladés en raison de l'absence de réponse.

Incidents en dehors du SLA : Vous pouvez également voir quels incidents ont dépassé un délai de réponse (temps de confirmation) ou un délai de résolution SLA. Par défaut, nous indiquons un délai de réponse de 5 minutes et un délai de résolution SLA de 60 minutes, mais vous pouvez facilement personnaliser les SLA pour qu'ils correspondent à ceux en vigueur pour votre équipe.

Classement de la résolution des incidents : Découvrez combien d’incidents chaque membre de l’équipe a résolu.

Prêt à commencer?

Si vous avez accès à Advanced Analytics, suivez nos instructions étape par étape pour utiliser notre exportation CSV avancée et notre visualisation de feuille de calcul modèle pour répondre à ces questions et à bien d’autres.

Monitoring_Ebook_728_90