PagerDuty image

PagerDuty permet un nouveau niveau de réponse aux incidents pour Hyland Software

PagerDuty image

Taille: 1 001 - 5 000

Industrie: Technologie

Emplacement: Westlake, Ohio

Client depuis : 2019

Intégrations clés :

Dynatrace
Splunk

En 1991, Packy Hyland Jr. a convaincu une banque du Wisconsin qu'elle pouvait économiser sur les coûts d'impression en stockant les rapports sur des disques optiques. Cette innovation précoce est devenue OnBase et a permis Logiciel Hyland en passe de devenir un fournisseur leader de traitement, de stockage et de gestion de données.

Plateforme d'information d'entreprise universelle, OnBase centralise le contenu de l'entreprise dans un emplacement sécurisé. Elle fournit ensuite les informations pertinentes au moment et à l'endroit où elles sont nécessaires, augmentant ainsi la productivité, offrant un excellent service client et réduisant les risques.

Au service de plus de la moitié des entreprises Fortune 100 parmi ses milliers de clients mondiaux, il est essentiel pour l'équipe d'infrastructure de Hyland de garantir la disponibilité de ces technologies, solutions et services basés sur le cloud.

Une diffusion inefficace des alertes impacte les délais de résolution

L'équipe en charge de l'infrastructure avait du mal à transmettre des informations exploitables aux bons intervenants. « Avant PagerDuty, nous disposions de plusieurs solutions de surveillance qui envoyaient des alertes de différentes manières », explique Brian Long, ingénieur en observabilité. « Nous avions du mal à transmettre les bonnes informations à la bonne équipe, ou les alertes étaient envoyées dans des formats fixes qui ne mettaient pas nécessairement en avant les informations pertinentes. »

Par exemple, lorsque l’équipe avait besoin d’être informée de diverses suppressions de versions Les alertes se présentaient sous la forme d'un bloc de texte géant sans mise en forme. Les informations n'étaient pas exploitables et manquaient de détails sur l'instance concernée, le point de terminaison en cours de retrait et le travail à effectuer sur celui-ci. Même les intervenants expérimentés auraient besoin d'efforts et de temps supplémentaires pour se plonger dans le problème et le comprendre.

De plus, le triage et les remontées d'informations entre équipes étaient incohérents et parfois inefficaces, ce qui entraînait une collaboration lente ou maladroite. « De nombreux processus qui fonctionnaient pendant les horaires de travail normaux, comme la prise de contact avec ces équipes via Slack, n'étaient pas fiables si ces équipes étaient en dehors des heures de travail ou si la réponse était gérée par une équipe 24h/24 et 7j/7 qui devait ensuite faire appel à une équipe non 24h/24 et 7j/7 », a déclaré Long.

Hyland avait besoin d’améliorer l’expérience utilisateur pour les ingénieurs et d’accélérer la résolution des problèmes.

Comment Hyland a exploité PagerDuty pour un routage et un enrichissement plus intelligents des événements

L'entreprise s'est tournée vers PagerDuty AIOps pour aider à enrichir et à normaliser les données d'événements afin que les intervenants disposent d'un meilleur contexte lors de la réponse aux incidents. Orchestration d'événements mondiaux utilise une logique personnalisée et des règles imbriquées pour enrichir et contrôler le routage, ou pour déclencher des actions webhook en fonction des conditions d'événement.

Orchestration d'événements mondiaux réduit le travail manuel en connectant le traitement des événements en temps réel à l'automatisation intelligente. « L'exploitation de Global Event Orchestration de PagerDuty a été essentielle pour garantir que nos processus de routage d'événements sont efficaces et évolutifs afin d'optimiser les opérations et les dépenses informatiques. Grâce à Global Event Orchestration, notre organisation est en mesure de détecter la condition « résolue » à partir de nos notifications pour l'exécuter comme une résolution et réduire le nombre d'endroits où ces conditions doivent être configurées d'au moins un facteur trois. Cela nous libère du temps pour nous concentrer sur l'innovation, et non sur la configuration », a déclaré Long.

Global Event Orchestration a aidé Hyland à résoudre le problème des alertes mal formatées, comme les divers retraits de versions. En fonction des métadonnées, l'alerte est transmise de manière intelligente au service approprié. En ajoutant Transformations et définir Variables personnalisées , les termes et codes complexes des machines sont traduits en contexte utile pour que les intervenants puissent répondre efficacement au problème. « En utilisant des variables personnalisées, nous sommes en mesure d'écrire des morceaux de texte qui rendent les informations d'alerte plus humaines et plus faciles à comprendre », explique Long. « Nous savons maintenant de quelle version il s'agit, sur quel compte elle se trouve et sur quelle instance ou machine il faut agir. L'intervenant en alerte peut alors se mobiliser rapidement, identifier les informations supplémentaires qui ne sont pas envoyées dans le cadre de la charge utile et résoudre le problème beaucoup plus rapidement. »

Mobiliser les équipes plus rapidement grâce aux jeux de réponse

Hyland a également utilisé PagerDuty pour constituer et mobiliser des équipes interfonctionnelles, en faisant appel à des experts en la matière supplémentaires lorsque l'assistance est nécessaire et en accélérant encore les délais de résolution. Pièces de réponse , les actions d'incident peuvent être exécutées en appuyant sur un bouton, qui sont transmises directement à l'équipe appropriée en fonction des politiques d'escalade préconfigurées dans PagerDuty. Le nom de chaque Response Play est exploitable, de sorte que l'utilisateur sait exactement ce qui va se passer en cliquant dessus. « Toutes les actions sont suivies sur l'incident afin que la personne qui contacte l'incident sache ce qui se passe », a déclaré Long.

Avantages de la livraison intelligente

PagerDuty a eu un impact significatif sur l'équipe d'infrastructure de Hyland, contribuant à garantir un environnement cloud toujours opérationnel pour les clients. L'équipe a constaté des améliorations parmi lesquelles :

  • Réduction des processus manuels et du travail. L'orchestration d'événements mondiaux de PagerDuty AIOps utilise un puissant moteur de décision pour transmettre les bonnes informations aux bons intervenants.
  • Des notifications plus significatives. PagerDuty AIOps   Les variables personnalisées garantissent que les informations sont faciles à comprendre pour un tri rapide, précis et exploitable.
  • Des délais de résolution plus rapides. Les jeux de réponse aident à rassembler et à mobiliser l’action inter-équipes pour faire face à des incidents complexes.

« Lorsque nous avons examiné nos problèmes, nous avons constaté que nous avions des alertes qui devaient potentiellement être transmises à différentes équipes, que les alertes étaient mal formatées et que nous rencontrions des obstacles et des problèmes pour communiquer avec d'autres équipes », a déclaré Long. «PagerDuty a résolu tout cela pour nous. »

Regardez la session Summit '22 de Brian— Distribution intelligente et mobilisation des PME : garantir une diffusion et une résolution efficaces des alertes .

Cliquez ici pour en savoir plus sur la manière dont PagerDuty aide les entreprises à transformer leurs opérations numériques et Commencez un essai gratuit de 14 jours aujourd'hui.