4 nouvelles façons d'améliorer la gestion des incidents grâce à l'orchestration des événements
À une époque où l’efficacité et l’intégration intelligente des technologies sont essentielles, 71% des leaders techniques Les entreprises ont annoncé cette année qu'elles augmentaient leurs investissements dans l'intelligence artificielle (IA) et l'apprentissage automatique (ML). Compte tenu du volume considérable de données entrant dans l'entreprise et de la nécessité d'une réponse rapide, il est impossible de surveiller chaque alerte entrante 24 heures sur 24, et la vigilance humaine seule est trop imprécise. Au lieu de cela, l'exploitation de prévisions basées sur les données et sur la façon dont votre système a fonctionné historiquement peut fournir une approche plus efficace pour gérer et répondre aux incidents. C'est là qu'entre en jeu l'orchestration d'événements de PagerDuty.
L'orchestration d'événements aide les organisations à y parvenir en créant une automatisation de bout en bout pilotée par les événements. Cette capacité améliore la façon dont les organisations détectent les incidents, corrèlent plus rapidement les causes profondes et évoluent maturité opérationnelle au sein des équipes techniques afin qu’elles puissent travailler de manière plus cohérente et efficace.
Avec Variables d'orchestration d'événements , les équipes peuvent créer une automatisation intelligente qui s'intègre parfaitement à d'autres outils et processus, permettant une réponse aux incidents plus ciblée et standardisée dans toute l'organisation. Cette nouvelle fonctionnalité d'orchestration d'événements vous aide à tirer les leçons des incidents passés et à éviter qu'ils ne se reproduisent. Le résultat est une posture plus proactive vis-à-vis des opérations, avec des résultats évolutifs et reproductibles qui profitent à l'ensemble de l'écosystème technologique.
Découvrons quatre façons dont vous pouvez utiliser cette nouvelle fonctionnalité dès aujourd’hui.
1. Automatisation de la gestion des incidents majeurs
La plupart des organisations gèrent les incidents majeurs différemment des incidents de moindre priorité. Un incident majeur peut nécessiter des chemins d'escalade, des flux de travail et des processus internes différents. Par conséquent, l'automatisation lors d'incidents majeurs est souvent plus personnalisée.
Grâce aux variables d'orchestration d'événements, les équipes peuvent désormais prédire les incidents majeurs et moduler la manière dont l'incident est géré via l'automatisation. Par exemple, vous pouvez définir un seuil d'événements qui déclenchera les processus d'incident majeur appropriés si les critères d'événement correspondent à ce que vous savez pour signifier un incident majeur. L'orchestration d'événements ne traite pas chaque événement comme une instance unique et distincte. Au lieu de cela, elle utilise les événements comme base historique pour prendre des décisions éclairées sur l'état du système au fil du temps.
Cette nouvelle approche diffère des approches traditionnelles de déclenchement d'incidents majeurs via l'automatisation. Plutôt que de considérer un événement unique comme un signe d'incident majeur, vous pouvez évaluer l'état de votre système plus précisément en sachant ce qui s'est passé récemment et dans quelle mesure les circonstances correspondent aux incidents majeurs précédents.
2. Automatisation réactive
De nombreuses organisations s'appuient sur des diagnostics automatisés ou des solutions de correction automatique pour donner aux intervenants une longueur d'avance. Cependant, l'automatisation n'est pas consciente d'elle-même. Elle ne sait pas ce qui a déjà été exécuté sur d'autres événements récemment arrivés dans le système. Par conséquent, l'automatisation tente souvent de s'exécuter plusieurs fois pour des événements similaires sans réellement fournir de véritables informations ou résolutions au problème.
Vous pouvez désormais créer une automatisation qui vérifie si des diagnostics ont été exécutés et modifier les chemins d'automatisation en fonction de la réponse. Par exemple, si un diagnostic a été exécuté récemment pour une orchestration d'événements, l'automatisation comprend qu'elle n'a pas besoin d'exécuter à nouveau les diagnostics. Elle lance également une séquence d'automatisation supplémentaire telle que la correction automatique.
Cette automatisation réactive (ou automatisation déclenchant intelligemment davantage d’automatisations) donne aux organisations plus de flexibilité et de contrôle sur le moment où l’automatisation se produit et sur ce qu’il faut faire avec les commentaires de ces séquences.
3. Automatisation dynamique
Les entreprises souhaitent exécuter l'automatisation de manière éclairée, en ciblant précisément l'application ou l'infrastructure défaillante. Cependant, si vous ne pouvez accéder qu'à un seul événement, il est difficile de savoir quelle partie de votre pile a échoué et d'exécuter l'automatisation en conséquence.
L'orchestration d'événements vous permet d'extraire et de stocker des informations sur les parties de votre pile qui ont rencontré des problèmes afin que vous puissiez enrichir ces informations dans une automatisation future pour un ciblage plus précis.
Par exemple, vous pouvez définir une variable qui extrait des données d'une charge utile. Si la charge utile de l'événement correspond à une certaine circonstance, telle qu'un événement Kubernetes, vous pouvez renseigner les informations du nœud. Vous pouvez ensuite créer une séquence d'automatisation pour identifier et redémarrer dynamiquement ce nœud défaillant précis.
4. Automatisation auto-configurable
En cas de problème, il ne suffit pas de faire une estimation approximative de ce qui s'est passé. Les intervenants doivent disposer immédiatement des bonnes informations de triage pour déterminer la cause profonde et accélérer la résolution.
Dans ces cas, les variables peuvent aider les organisations à obtenir immédiatement les bonnes informations de triage et à identifier les défaillances dans un système avec une automatisation qui s'auto-configure tout au long du processus de réponse. Par exemple, lorsqu'un événement est lié à un élément d'infrastructure qui rencontre actuellement un problème, l'automatisation configure la règle et ajoute un contexte clé comme des notes.
Cette nouvelle fonctionnalité rend l'automatisation au sein de PagerDuty plus évolutive et permet de faire remonter les informations le plus rapidement possible. Elle réduit le temps nécessaire non seulement pour résoudre les incidents, mais également pour créer et déployer l'automatisation dans un écosystème technique complexe.
Si vous êtes un client AIOps PagerDuty existant et intéressé par la création d'une automatisation comme celle-ci, regardez ceci courte visite guidée ou Démonstration de Twitch par Frank Emery, chef de produit principal .
Vous n'êtes pas client PagerDuty AIOps ? Essayez-le aujourd'hui et créez une automatisation pilotée par événements qui vous aidera à réduire le travail et à améliorer l'efficacité de l'ensemble de l'organisation.