- PagerDuty /
- Blog /
- Gestion d'événements /
- Utilisation de l'orchestration d'événements pour réduire le bruit et déclencher la meilleure action suivante
Blog
Utilisation de l'orchestration d'événements pour réduire le bruit et déclencher la meilleure action suivante
Nous entendons souvent de nos clients qu'ils sont confrontés à des niveaux de bruit et de complexité ingérables, ce qui rend plus difficile l'identification des causes profondes et la résolution rapide des problèmes. Tous ces efforts consacrés à l'analyse du bruit, au traitement des événements et à la collecte du contexte se traduisent par une perte de temps considérable.
C'est pourquoi nous avons lancé Event Orchestration, qui est devenu disponible pour nos clients Event Intelligence et Digital Operations lundi.
J'ai rencontré Frank Emery, chef de produit senior pour l'orchestration d'événements chez PagerDuty pour en savoir plus sur la fonctionnalité : pourquoi nous l'avons créée et comment le comportement et les commentaires des clients ont influencé la façon dont il a dirigé le développement.
Q : Parlez-moi de la nouvelle fonctionnalité Event Orchestration. Quel problème tente-t-elle de résoudre ?
R : Lorsque nous avons examiné la plateforme PagerDuty , nous avons constaté que 20 % des incidents sont résolus en cinq minutes ou moins. Aucun incident majeur difficile à résoudre ne peut être résolu en cinq minutes ou moins. Ce que cela nous dit, c'est qu'il existe des processus bien compris impliqués dans la réponse aux incidents, comme l'exécution de tests de diagnostic ou le redémarrage d'un serveur, qui sont nécessaires mais manuels, et qu'ils prennent beaucoup de temps aux équipes, ce qui, à son tour, ronge le temps. productivité et concentration. Ce sont désormais les types de cas d’utilisation que vous pouvez cibler avec une automatisation précise pour raccourcir ces étapes lors de la réponse aux incidents. Dans certains cas, vous pourriez même commencer à supprimer les incidents des assiettes des gens. Lorsque vous envisagez d'étendre ces cas d'utilisation pour cibler les tâches répétitives qui entraînent des incidents avec des temps de résolution de 15 ou 30 minutes, le potentiel de gain de temps, ainsi que la productivité et la concentration qui en résultent, s'améliorent encore.
C'était notre objectif principal : comment pouvons-nous aider nos clients à utiliser notre plateforme pour réduire le temps qu'ils doivent consacrer aux tâches manuelles et répétitives que les équipes doivent toujours effectuer lorsqu'elles sont confrontées à un incident ? Comment pouvons-nous intégrer l'automatisation afin de réduire le nombre d'événements plus faciles à gérer qui arrivent aux intervenants, afin qu'ils puissent consacrer leur temps aux incidents qui nécessitent réellement leur expertise en la matière ?
Lorsque nous réfléchissons à l’orchestration d’événements : si nous donnons à nos clients plus de flexibilité dans la façon dont ils configurent les règles et la possibilité d’utiliser davantage de fonctions d’automatisation en amont, pourrions-nous couvrir autant de tâches bien comprises que possible avant même que les équipes ne soient averties ?
Q : Que vous permet de faire exactement l'orchestration d'événements et en quoi est-elle différente des règles d'événements ?
R : Nous avons effectivement pris les règles d'événement et créé un moteur de décision qui se trouve directement dans le pipeline d'ingestion d'événements. L'orchestration d'événements vous permet d'utiliser un nouveau langage de condition que vous créez avec une logique complexe pour déclencher la meilleure action suivante en fonction des conditions à grande échelle. Dans certains cas, il s'agit de suppression, dans d'autres, il s'agit de routage, et certaines équipes voudront déclencher des actions d'automatisation telles que des diagnostics automatisés ou une correction automatique au fur et à mesure de leur ingestion en temps réel.
La configuration des orchestrations pour gérer des situations spécifiques en fonction des conditions permet à la machine d'utiliser la logique pour identifier des situations spécifiques et, en fonction de leur apparence, de déterminer comment les gérer. Cela permet au moteur de décision de prendre en charge certaines de ces tâches avant même que quelqu'un ne reçoive une notification et de commencer réellement à améliorer le processus de réponse aux incidents pour l'humain si cela est nécessaire en premier lieu.
Q : Quels sont les cas d’utilisation faciles à réaliser pour quelqu’un qui envisage d’utiliser Event Orchestration ?
R : Lorsque vous pensez à nos clients, ils vont le plus souvent utiliser cela de deux manières différentes.
Le premier problème est la réduction du bruit. Le bruit est un problème très courant, ce qui n’est pas surprenant quand on pense à tous les outils que les gens utilisent pour surveiller leurs piles et à la façon dont ils envoient tous des alertes. Nous disposons d’autres fonctionnalités telles que la déduplication et la suppression, ou des options ML telles que le regroupement intelligent des alertes pour vous aider, mais certains de nos clients souhaitent être très précis, et c’est là que les règles d’événements et l’orchestration peuvent s’avérer particulièrement utiles. En utilisant l’orchestration d’événements pour la réduction du bruit, un utilisateur peut utiliser des conditions de règles précises pour configurer un certain nombre de situations très ciblées dans lesquelles vous pouvez dévier, consolider ou supprimer le bruit pour que vos équipes ne laissent passer que les signaux critiques.
Le deuxième aspect est l'automatisation : son degré de sophistication dépend de la maturité opérationnelle. Il existe un énorme potentiel d'automatisation de certaines des premières phases de réponse aux incidents, mais de nombreuses étapes sont en réalité très répétitives.
Pensez à votre service le plus bruyant et demandez-vous combien d'incidents sur ce service nécessitent les mêmes étapes de diagnostic initiales. Les ingénieurs nous le disent tout le temps : chaque fois qu'il y a une panne, ils sont appelés et il y a ensuite ces étapes qu'ils doivent suivre à chaque fois avant que quiconque puisse faire quoi que ce soit pour commencer à résoudre le problème. En général, il s'agit d'exécuter des scripts et de collecter des informations pour trouver le bon contexte. Tout cela est important, mais cela n'est pas propre à l'incident et vous ne pouvez rien faire avec tant que vous n'avez pas obtenu de résultats. L'automatisation des diagnostics est la solution idéale dans ce scénario pour commencer à automatiser ces tâches répétitives bien connues qui sont nécessaires dans de nombreux scénarios.
—
Vous souhaitez en savoir plus ? Vous pouvez en apprendre davantage sur l'orchestration d'événements sur le site Base de connaissances article ou par regarder la démo ici .
Nous sommes aussi héberger un webinaire le 15 février, où vous pourrez entendre Frank Emery, chef de produit senior chez PagerDuty, qui présentera un aperçu de la nouvelle fonctionnalité, partagera les cas d'utilisation courants que nous avons vus dans notre programme d'accès anticipé et montrera une démo. Que vous cherchiez à améliorer votre jeu d'automatisation, que vous souhaitiez consolider les outils de gestion d'événements ou que vous essayiez simplement de commencer à utiliser des règles d'événements plus complexes, vous ne voulez pas manquer cette session. Inscrivez-vous ici .