Blog

Incidents avec un bouton de volume : Présentation des urgences d'incident !

par Sam Lewis 10 septembre 2015 | 3 minutes de lecture

Intégrez chaque dernier événement dans PagerDuty sans risquer la fatigue des alertes

email-hero_transparent

Vous DEVRIEZ vous soucier des petites choses

Nous savons que alerte fatigue est une préoccupation majeure pour nos utilisateurs. Quand tout est important, rien n’est important. Mais « non critique » n’est pas synonyme d’« insignifiant » ; en fait, les problèmes non critiques sont souvent révélateurs d’un problème plus important à venir. Désormais, grâce à Incident Urgencies, les utilisateurs peuvent suivre en toute confiance tous ces événements et ne se réveiller que pour les incidents les plus importants qui en résultent.
Une grande partie de ce qui a rendu PagerDuty utile pour nos clients réside dans l'analyse et la possibilité de voir ce qui se passe avec les incidents sur tous leurs systèmes et outils de surveillance. En gardant les événements non critiques hors de PagerDuty , ces analyses d'incidents ne racontent qu'une partie de l'histoire. Et plus vous disposez de données, plus il est facile d’éviter que des incidents ne se reproduisent à l’avenir.

Screen Shot 2015-09-03 at 4.02.44 PM

Choisissez l'urgence de la notification pour les incidents sur ce service.

Mais pas au milieu de la nuit

PagerDuty a toujours aidé les ingénieurs de garde à résoudre les incidents nécessitant une attention immédiate. Mais qu’en est-il des problèmes moins urgents ? Parce qu'ils ne pouvaient pas trier ou répéter les alertes, certains utilisateurs ne transmettaient pas les événements mineurs via PagerDuty pour éviter d'être réveillés au milieu de la nuit. Cela signifie qu'il leur manquait des informations clés dans leurs analyses sur les problèmes potentiels, ce qui rendait leurs équipes moins préparées à les gérer lorsqu'elles survenaient.

Jusqu'à présent, les utilisateurs de PagerDuty n'étaient pas en mesure de trier leurs incidents par urgence. Chaque incident a été enregistré avec le même niveau d'importance. Jusqu'à présent, un disque proche de 80 % de sa capacité se voyait attribuer le même niveau d'importance que votre disque dur. le serveur part en flammes Il n’était pas toujours facile de distinguer ce qui nécessitait vraiment une attention particulière et ce qui pouvait attendre.

Screen Shot 2015-09-03 at 4.04.02 PM (1)

Triez vos incidents par urgence.

Dis m'en plus!

Désormais, les utilisateurs peuvent désigner des services avec un paramètre d'urgence élevée ou faible et personnaliser leurs règles de notification d'incident en fonction de l'urgence. Lorsque des incidents sont déclenchés sur un service à faible urgence, les notifications suivront les règles de notification à faible urgence des utilisateurs et ne s'intensifieront pas. Par exemple, les incidents définis sur « faible urgence » pourraient utiliser uniquement le courrier électronique pour les notifications au lieu des SMS et des appels téléphoniques.

Les équipes particulièrement avancées peuvent exploiter les urgences d'incident personnalisées non seulement pour spécifier comment les différents niveaux d'urgence se présentent, mais également pour modifier ces règles en fonction de l'heure de la journée. Un cas d'utilisation courant : pendant les heures de travail, certains incidents sont urgents, mais pendant la nuit et le week-end, ils ne le sont pas. Pour illustrer cela, pensez à un environnement de préparation défaillant. Le week-end ou la nuit, ce n'est pas un problème, mais à 9 heures du matin le lundi, il doit être résolu immédiatement, sinon le cours normal des activités est en danger. De nombreux incidents ne sont critiques que pendant les heures de bureau. Les urgences d'incident personnalisées permettent aux entreprises de définir ces paramètres.
Les utilisateurs peuvent également utiliser notre nouveau bouton de répétition pour cesser d'alerter en cas d'incident qui ne peut pas être résolu immédiatement (ou n'a pas besoin de l'être !). Avant cette fonctionnalité, les utilisateurs n'avaient que la possibilité d'accuser réception ou de faire remonter l'incident, ce qui n'aidait pas les équipes à suivre l'état de cet incident. En acceptant davantage d'événements et en vous permettant de définir l'urgence de l'incident qui en résulte, PagerDuty fournit un tableau de bord système central pour tous vos incidents, aidant ainsi votre organisation à mieux travailler pour prioriser, résoudre et prévenir les problèmes à l'avenir.

Prêt à commencer ? Découvrez notre guide d'installation et en savoir plus sur ce que les urgences hautes et basses ressemblent à sur notre application et sur notre site internet.

Monitoring_Ebook_728_90