Blog

Éliminez le chaos grâce à PagerDuty Event Intelligence

par David Shackelford 7 juin 2018 | 4 minutes de lecture

Dans tous les secteurs et modèles opérationnels que nous servons, les clients nous disent qu'ils ont du mal à trouver le signal exploitable dans un océan de données. Les systèmes et les services gérés par les équipes deviennent chaque année plus complexes et les effectifs n'évoluent jamais au même rythme.

Cela signifie que le volume de télémétrie que les organisations doivent gérer n’est plus gérable avec les méthodes existantes : de nombreuses entreprises doivent gérer des milliers, voire des millions, d’événements par jour. Plusieurs organisations nous ont dit que lorsqu’un incident majeur survient, leurs intervenants doivent éteindre leurs téléphones pour éviter qu’une tempête d’alertes ne les submerge de notifications en double. Cette situation est agaçante et gênante, surtout lorsque les enjeux sont extrêmement élevés, mais pire encore, elle rend également impossible l’identification rapide du problème réel. Et pour l’entreprise, cela se traduit par une perte de temps de résolution et des risques supplémentaires.

De la gestion d'événements à l'intelligence événementielle

La réduction du bruit a toujours fait partie de la mission de PagerDuty, et notre plateforme y est parvenue en automatisant la planification et les escalades des astreintes, en soutenant une collaboration efficace et une réponse aux incidents, et en fournissant des rapports et des informations, le tout d'une manière qui permet aux équipes de maîtriser leur propre destin.

Mais maintenant, nous allons plus loin, avec un nouveau produit qui donne à votre équipe des super pouvoirs pour gérer le flot croissant de signaux provenant de tous vos outils et infrastructures.

Renseignements sur les événements s'attaque à de nombreux problèmes universels dans le monde de la gestion d'événements, notamment la collecte de signaux provenant de tous vos outils, la suppression du bruit, la corrélation des alertes exploitables et la transmission de ces informations aux intervenants. Mais il le fait d'une manière nouvelle et unique, en fusionnant les données système et humaines pour réduire le bruit, concentrer votre réponse et responsabiliser votre équipe.

Regroupement d'alertes intelligent est né d'une idée simple : vous pouvez faire beaucoup de choses avec les données riches de vos systèmes, mais ce qui est tout aussi important (peut-être plus) est ce que les intervenants font avec ces données. L'infrastructure évolue et change, les équipes créent de nouveaux services qui interagissent de manière imprévisible, et les approches traditionnelles de commandement et de contrôle ne peuvent tout simplement pas suivre.

Mais en observant la façon dont les utilisateurs d'une équipe interagissent avec leurs problèmes opérationnels et en tirant les leçons de ce comportement au fil du temps, nous pouvons corréler efficacement les alertes et éliminer le bruit même lorsque le système grandit et évolue, ce qui permet aux clients d'économiser énormément de temps et d'argent et de permettre à leurs intervenants de se concentrer sur un travail de plus haut niveau et plus impactant.

 

Une fois vos alertes corrélées à un incident exploitable, il est temps de réagir. Incidents similaires examine l'historique des réponses d'un compte pour les incidents liés au compte actuel, en utilisant la science des données pour mettre le contexte exact à portée de main des intervenants. Les intervenants peuvent facilement déterminer si un incident est un incident de routine ou une anomalie potentiellement dangereuse, et consulter les notes et autres métadonnées des incidents passés pour faciliter le tri. En voyant des tendances dans les problèmes opérationnels qui n'apparaissent que sous forme agrégée, les intervenants sont plus confiants et plus efficaces, et gagnent un temps précieux au moment le plus important.

« Des incidents similaires, c'est comme avoir un intervenant supplémentaire dans l'équipe. » – Corey Burke, Dialpad

Dans les coulisses, Automatisation avancée des événements filtre, enrichit et hiérarchise vos signaux, garantissant que rien n'informe inutilement un humain - et que les signaux qui faire inclure tout le contexte approprié, tel que les manuels d'exécution et les informations de correction.

Nous avons présenté en avant-première bon nombre de ces fonctionnalités lors du PagerDuty Summit de l'année dernière et avons reçu d'excellents retours de la part de centaines de clients ayant bénéficié d'un accès anticipé. Ils nous ont dit qu'Event Intelligence avait remplacé les processus de tri manuel, amélioré la qualité de vie de leurs intervenants et leur avait fait gagner d'innombrables heures de configuration et de maintenance. Et en examinant nos clients qui utilisent ces fonctionnalités, nous avons constaté une réduction globale du bruit de 98 % grâce au filtrage, à la suppression et à la corrélation intelligente des signaux.

Essayez-le aujourd'hui

Nous sommes désormais ravis de proposer Event Intelligence à tous nos clients. Pour commencer, contactez votre représentant PagerDuty dès aujourd'hui ou Inscrivez-vous pour un essai gratuit .