Concentrez votre réponse sur ce qui compte
La surveillance des systèmes et des applications informatiques est une science complexe, et chez PagerDuty, nous sommes fiers de nous intégrer à plus de 175 outils ITOps, DevOps et ChatOps différents qui peut détecter les problèmes et les exceptions dans les applications et l'infrastructure.
Cependant, même avec un traitement sophistiqué à la source, les données de surveillance peuvent être bruyantes, redondantes ou non exploitables. Bien que de nombreux outils disposent de fonctionnalités permettant de réduire les alertes en double ou les flottements, il est toujours difficile pour les outils de surveillance eux-mêmes de déterminer ce qui nécessite une attention humaine immédiate et ce qui n'en nécessite pas. L'ajustement des seuils ou la configuration du mode de maintenance à la source peut être un processus ardu et manuel, et oblige les équipes à rechercher plusieurs sources de vérité pour voir toutes leurs données.
Parallèlement, les équipes opérationnelles sont plus performantes lorsqu'elles peuvent visualiser toutes leurs données dans un seul et même écran. Les alertes et événements de faible priorité servent souvent d'indicateurs avancés de problèmes latents et sont utiles pour les analyses post-mortem et la détection de tendances à des échelles de temps de l'ordre de quelques jours, semaines ou mois.
Suppression
C'est pourquoi nous sommes fiers de présenter le nouveau PagerDuty Suppression capacité. Avec la suppression, vous pouvez envoyer toutes vos données d'exploitation à PagerDuty et déclencher une réponse aux incidents uniquement pour les éléments immédiatement exploitables. La suppression permet de lutter contre la fatigue des alertes, de contrôler les flux d'événements complexes et offre aux équipes une source unique de vérité en fournissant toutes leurs données d'exploitation dans un emplacement centralisé.
Activer Suppression , vous devrez configurer Règlement de l'événement Les règles d'événement vous permettent d'analyser dynamiquement le contenu des événements entrants et de choisir s'ils doivent ou non déclencher la création d'un incident. Apprenez comment procéder dans notre base de connaissances.
Vous pouvez trouver des règles d'événement sur n'importe quel service utilisant des intégrations de type API et notre nouveau Alertes et incidents modèle de données. En utilisant notre nouveau Format d'événement commun PagerDuty , les clients peuvent appliquer la même règle à toutes les intégrations d'API du service, plutôt que de devoir mémoriser le schéma de données de chaque outil de surveillance. Vous pouvez faire correspondre les événements à l'aide d'une simple instruction « Contains », ainsi que d'expressions régulières ou en recherchant l'existence d'un champ spécifique.
Vous pouvez trouver les alertes supprimées dans la nouvelle liste d'alertes, ainsi que les visualiser et les analyser dans la toute nouvelle Application de santé des infrastructures . Propulsé par notre nouveau modèle de données d'alerte et d'incident , ces fonctionnalités améliorent considérablement la capacité des intervenants et des gestionnaires à se concentrer sur les bonnes données au bon moment, à identifier de manière proactive les tendances des événements et à améliorer en permanence leurs performances opérationnelles. Vous pouvez envoyer plus de données dans PagerDuty, être moins souvent averti et voir des indicateurs de pointe sur les problèmes et les défaillances de service en cascade pour résoudre les problèmes avant qu'ils ne deviennent des urgences.
La suppression est disponible pour tous les clients Standard et Enterprise, pour vous aider, vous et votre équipe, à mieux contrôler vos données d'exploitation.
Nous aimerions connaître votre avis sur cette fonctionnalité. Vous trouverez un guide complet sur la configuration de cette fonctionnalité dans notre base de connaissances Veuillez nous envoyer un e-mail à support@pagerduty.com avec toutes questions ou suggestions que vous avez pour nous concernant cette fonctionnalité.