Blog

Santé des opérations informatiques — Visualisation

par David Cooper 21 novembre 2016 | 3 minutes de lecture

Opérations informatiques Aujourd'hui, les professionnels ont besoin d'un contexte à l'échelle de l'infrastructure pour remédier efficacement aux incidents, réduire les alertes non exploitables et améliorer en permanence les capacités de gestion des incidents. Avec la prolifération des architectures de microservices, les applications deviennent rapidement plus complexes et génèrent toujours plus de télémétrie. Ces tendances aggravent la difficulté d'obtenir une visibilité étendue opérations santé sensibilisation et compréhension de l'impact sur l'entreprise. Par conséquent, les intervenants en cas d'incident manquent souvent de visibilité sur le rayon d'explosion des incidents.

Pour résoudre ce problème, PagerDuty a publié le Application de santé des infrastructures , une application de renseignement de base alimentant le Console de commande des opérations .

infrastructure-health

La chronologie ultime

L'application Infrastructure Health fournit un aperçu visuel de tous les clusters d'alertes sur les services et les hôtes de votre infrastructure informatique. Ces visualisations peuvent être utilisées de plusieurs manières, non seulement pour faciliter la réponse aux incidents, mais également pour vous aider à améliorer l'intégrité et les performances globales de vos applications.

    • Pendant la fusillade

      L'application Infrastructure Health est mise à jour en temps réel, en défilant de droite à gauche au fur et à mesure que les alertes et les événements arrivent.

      Les intervenants peuvent consulter l'application Infrastructure Health pendant un incident pour évaluer rapidement l'ampleur des problèmes en question. Par exemple, un seul service est-il en panne ? Ou êtes-vous confronté à un incident de type cascade impliquant plusieurs services qui nécessitera la mobilisation d'équipes et de ressources supplémentaires ?

    • Lors d'une autopsie

      Une fois la poussière retombée, vous devez déterminer pourquoi les choses ont mal tourné et comment garantir que le même incident ne se reproduise pas.

      L'examen de la chronologie des événements dans l'application Infrastructure Health avant la désignation de l'incident peut conduire à des informations uniques. Y avait-il des indicateurs de pointe de l'incident ? Avons-nous correctement configuré les alertes ou cet incident s'est-il produit sans avertissement préalable ?

    • Déduction proactive

      Recherchez des modèles dans vos données d’infrastructure et repérez les principaux indicateurs de problèmes avant qu’ils ne se transforment en incidents.

      Vous pouvez également améliorer vos alertes en identifiant les services particulièrement actifs qui contactent en permanence votre équipe. Enfin, vous pouvez faire pivoter votre visualisation de l'état de l'infrastructure par source pour obtenir une perspective complètement différente sur vos données.

En tirant parti d'autres fonctionnalités de PagerDuty , vous pouvez profiter pleinement des visualisations de l'application Infrastructure Health.

      • Groupe de services :Utilisez PagerDuty Groupe de services fonctionnalité pour modéliser vos services PagerDuty en fonction des services critiques de votre entreprise.
      • Transformateur d'événements personnalisé :Introduisez des contextes d'événements supplémentaires, par exemple des déploiements et tweets , en utilisant notre Transformateur d'événements personnalisé La juxtaposition de ces événements avec vos clusters d’alertes est un outil puissant pour déterminer la cause première des incidents et comprendre l’impact sur le client.

L'infrastructure des applications de santé est l'une des nombreuses applications de Console de commande des opérations . Apprenez-en plus sur cette console et les autres applications qui la composent en consultant notre Article de blog sur la console de commande des opérations .

Inscrivez-vous à votre essai aujourd'hui et accélérez votre réponse aux incidents grâce à notre nouvelle console de commande des opérations, à notre application Infrastructure Health et bien plus encore !