Blog

Gardez une longueur d'avance sur les pannes grâce à une réponse proactive aux incidents

par Ariel Russo 18 juin 2020 | 5 minutes de lecture

Comment votre vie quotidienne serait-elle affectée si vous aviez une vue d'ensemble de vos opérations, de leurs dépendances et la capacité de repérer les indicateurs indiquant qu'un incident ou une panne est susceptible de se produire ? Que signifierait pour votre entreprise si vous disposiez de quelques minutes ou heures pour anticiper les perturbations au lieu de réagir à une surprise ? Pour la plupart des organisations, permettre une réponse proactive aux incidents se traduit directement par des économies d'argent, une protection de la réputation de la marque et une réduction de l'épuisement professionnel au sein des équipes d'intervention.

Être proactif signifie donner aux équipes techniques et commerciales les outils nécessaires pour s'orienter dans leurs services numériques afin qu'en cas de problème, elles ne partent pas d'un état d'ignorance. Dans un monde numérique où chaque seconde compte, les intervenants d'astreinte ne peuvent pas apprendre à la volée les infrastructures ou les procédures d'intervention. C'est pourquoi la préparation numérique est si importante.

Et même si cela pouvait sembler être un rêve lointain pour certains, la gestion proactive des incidents n'est plus un simple conte de fées. Avec les dernières améliorations de PagerDuty issues du Lancement de produit au printemps 2020 , vous pouvez obtenir une vue complète de vos services numériques pour toutes les équipes, leurs dépendances et les mesures opérationnelles pertinentes nécessaires pour fournir une assistance de qualité et prévenir les problèmes avant qu'ils ne deviennent des crises ayant un impact sur les revenus. Voyons comment PagerDuty rend cela possible.

Plongée en profondeur dans l'innovation

Profils de service dans l'annuaire de services dynamique

L’automne dernier, nous avons présenté le Annuaire de services dynamiques comme moyen de suivre et de gérer tous vos services dans un seul emplacement pratique. Nous avons créé ce répertoire car la complexité croissante et le rythme de changement au sein des piles technologiques informatiques signifient que les anciennes méthodes de travail (c'est-à-dire les approches centralisées et manuelles pour suivre les composants) ne sont tout simplement pas évolutives dans un monde natif du cloud.

Au lieu d'approches lentes et manuelles qui impliquent la découverte et la cartographie par une équipe distincte, l'annuaire de services dynamique de PagerDuty présente les informations de service capturées grâce à l'utilisation régulière de la plateforme. L'annuaire dispose non seulement d'API riches qui permettent l'automatisation, mais il est également basé sur l'équipe plutôt que centralisé.

Pour améliorer la quantité d’informations disponibles pour les intervenants, nous avons publié de nouvelles améliorations à notre annuaire de services dynamiques que nous appelons Profils de services Les profils de service apportent plus de sens et de contexte aux services en créant une architecture d'informations autour de chacun d'eux. Désormais, les responsables techniques et les intervenants d'astreinte peuvent voir des informations utiles pour chaque service, comme la propriété de l'équipe, les personnes d'astreinte, les alertes et incidents passés, les services dépendants, les cahiers d'exécution et les canaux de communication préférés.

Dépendances de service

À mesure que les organisations évoluent, il peut devenir difficile de démêler des incidents majeurs complexes et transversaux ou de comprendre comment l'infrastructure est connectée, ce qui peut entraîner des vulnérabilités potentielles. Et malgré tous les efforts d'une équipe, les wikis et les CMDB statiques gérés manuellement ont tous des perspectives limitées, voire obsolètes, sur l'état des dépendances.

C'est pourquoi nous avons introduit Dépendances de service dans PagerDuty, désormais disponible en accès anticipé. Les dépendances de service vous permettent de comprendre la relation entre les services afin d'identifier, de trier et de résoudre les problèmes plus rapidement. Les utilisateurs peuvent parcourir plusieurs services et niveaux de dépendances via une interface utilisateur intuitive pour exposer des informations clés telles que qui a modifié un service et quand. Les dépendances de service peuvent favoriser une puissante automatisation des réponses, fournir des informations précieuses en temps de paix sur les vulnérabilités et correspondre au modèle mental que les organisations ont de leur propre infrastructure.

Tableau de bord des services

Dans les organisations informatiques traditionnelles, il n'est pas rare que les équipes d'ingénierie ne soient pas conscientes ou incertaines de l'impact des incidents sur les services qu'elles fournissent. Sans cette compréhension, elles ne peuvent pas gérer de manière proactive les attentes des parties prenantes de l'entreprise ni concentrer leur équipe sur l'amélioration des éléments pertinents.

Pour aider les équipes d'ingénierie à surmonter ce problème, notre nouveau Tableau de bord des services fournit une visualisation des indicateurs opérationnels et des KPI, ce qui conduit à un meilleur alignement interfonctionnel et à de meilleurs résultats commerciaux. Grâce à cette vue centralisée, les créateurs et les opérateurs de services peuvent travailler ensemble pour gérer plus efficacement la disponibilité des produits, l'allocation des ressources et favoriser l'amélioration continue des équipes et des services.

Nouvelle expérience de la console de visibilité

Dans le contexte actuel, nous avons constaté que de nombreux clients devaient migrer leurs flux de travail physiques, en mode « visuel », d'un centre d'opérations réseau (NOC) réel vers un environnement virtuel, les opérateurs NOC travaillant à domicile. Cependant, ces opérateurs ont toujours besoin d'une vue consolidée des performances de service.

PagerDuty Console de visibilité , désormais disponible en accès anticipé, offre aux utilisateurs une vue en temps réel des opérations numériques. L'expérience repensée et adaptée comprend également un filtrage avancé et des mises en page personnalisables. Cette puissante console favorise non seulement la préparation opérationnelle, mais peut également aider à combler le fossé entre les équipes NOC et applicatives dans les organisations d'opérations hybrides. Plus important encore, cet outil permet aux équipes d'adopter une approche proactive de la réponse aux incidents, en fournissant le contexte nécessaire pour répondre aux besoins des clients dans les moments d'hyper-attention.

Pour mettre en place une réponse proactive aux incidents, votre équipe doit disposer du flux de travail, de l’automatisation et des informations sur les services que vous gérez afin d’être préparée à gérer les incidents lorsqu’ils se produisent. Dans le contexte économique actuel, les organisations ne doivent pas sous-estimer l’impact que cette approche peut avoir sur la réduction des coûts, la protection des relations avec les clients et la garantie de la résilience de l’entreprise.

Ces nouvelles fonctionnalités ne sont qu'un petit échantillon des nombreuses façons dont votre équipe peut utiliser PagerDuty pour obtenir une réponse proactive aux incidents. Si votre organisation pourrait bénéficier de l'un de ces outils, n'hésitez pas à consulter notre essai gratuit ou contactez votre gestionnaire de compte pour organiser une démonstration personnalisée.