PagerDuty image

PagerDuty ermöglicht Hyland Software eine neue Ebene der Vorfallreaktion

PagerDuty image

Größe: 1.001 - 5.000

Industrie: Technologie

Standort: Westlake, Ohio

Kunde seit: 2019

Wichtige Integrationen:

Dynatrace
Splunk

1991 überzeugte Packy Hyland Jr. eine Bank in Wisconsin, dass sie Druckkosten sparen könne, indem sie Berichte auf optischen Datenträgern speicherte. Diese frühe Innovation wurde zu OnBase und setzte Hyland Software auf dem Weg zu einem führenden Anbieter für Datenverarbeitung, -speicherung und -verwaltung.

OnBase ist eine universelle Informationsplattform für Unternehmen und zentralisiert Geschäftsinhalte an einem sicheren Ort. Anschließend liefert es relevante Informationen, wann und wo immer sie benötigt werden. So wird die Produktivität gesteigert, ein hervorragender Kundenservice gewährleistet und das Risiko verringert.

Hyland betreut mehr als die Hälfte der Fortune 100-Unternehmen unter seinen Tausenden von Kunden weltweit und daher ist es für das Infrastrukturteam von Hyland von entscheidender Bedeutung, die Verfügbarkeit dieser Cloud-basierten Technologien, Lösungen und Dienste sicherzustellen.

Ineffektive Alarmverteilung beeinträchtigt die Lösungszeiten

Das Infrastrukturteam hatte Mühe, den richtigen Einsatzkräften verwertbare Informationen zukommen zu lassen. „Vor PagerDuty hatten wir mehrere Überwachungslösungen, die Warnmeldungen auf unterschiedliche Weise übermittelten“, erklärte Brian Long, Observability Engineer. „Wir hatten Schwierigkeiten, die richtigen Informationen an das richtige Team weiterzuleiten, oder die Warnmeldungen wurden in festen Formaten übermittelt, die nicht unbedingt die relevanten Informationen an die erste Stelle setzten.“

Wenn das Team beispielsweise über die Einstellung verschiedener Versionen informiert werden musste , kamen die Warnmeldungen als riesiger Textblock ohne Formatierung. Die Informationen waren nicht verwertbar und es fehlten Details darüber, um welche Instanz es sich handelte, welcher Endpunkt außer Betrieb gesetzt wurde und welche Arbeiten daran durchgeführt werden mussten. Selbst erfahrene Einsatzkräfte brauchten zusätzliche Anstrengungen und Zeit, um das Problem zu verstehen.

Darüber hinaus waren die Triage und die teamübergreifenden Eskalationen inkonsistent und manchmal ineffektiv, was zu einer langsamen oder schwerfälligen Zusammenarbeit führte. „Viele der Prozesse, die während des normalen Arbeitsalltags funktionierten, wie z. B. die Kontaktaufnahme mit diesen Teams über Slack, waren nicht zuverlässig, wenn diese Teams außerhalb der Arbeitszeiten arbeiteten oder wenn die Antwort von einem rund um die Uhr besetzten Team bearbeitet wurde, das dann an ein nicht rund um die Uhr besetztes Team eskalieren musste“, sagte Long.

Hyland musste das Benutzererlebnis für Ingenieure verbessern und eine schnellere Lösung erreichen.

So nutzt Hyland PagerDuty für intelligenteres Event-Routing und -Anreicherung

Das Unternehmen wandte sich an PagerDuty AIOps um bei der Anreicherung und Normalisierung von Ereignisdaten zu helfen, damit die Einsatzkräfte bei der Reaktion auf Vorfälle einen besseren Kontext haben. Die Funktion Globale Event-Orchestrierung verwendet benutzerdefinierte Logik und Regelverschachtelung, um das Routing zu erweitern und zu steuern oder um Webhook-Aktionen basierend auf Ereignisbedingungen auszulösen.

Globale Event-Orchestrierung reduziert die manuelle Arbeit durch die Verbindung der Echtzeit-Ereignisverarbeitung mit intelligenter Automatisierung. „Die Nutzung von Global Event Orchestration von PagerDuty war entscheidend, um sicherzustellen, dass unsere Event-Routing-Prozesse effizient und skalierbar sind, um IT-Abläufe und -Ausgaben zu optimieren. Mit Global Event Orchestration kann unsere Organisation den Zustand ‚gelöst‘ aus unseren Benachrichtigungen erkennen, um ihn als Lösung auszuführen und die Anzahl der Stellen, an denen diese Bedingungen konfiguriert werden müssen, um mindestens den Faktor drei zu reduzieren. Dadurch haben wir mehr Zeit, uns auf Innovationen zu konzentrieren, nicht auf Konfiguration“, sagte Long.

Mithilfe von Global Event Orchestration konnte Hyland das Problem schlecht formatierter Warnmeldungen wie z. B. die Einstellung verschiedener Versionen lösen. Basierend auf den Metadaten wird die Warnmeldung intelligent an den richtigen Dienst übermittelt. Durch das Hinzufügen Transformationen und definieren Benutzerdefinierte Variablen , schwierige Maschinenbegriffe und Codes werden in einen hilfreichen Kontext übersetzt, damit die Helfer effektiv auf das Problem reagieren können. „Mithilfe benutzerdefinierter Variablen können wir Textteile schreiben, die die Warnmeldungen menschlicher und verständlicher machen“, erklärte Long. „Jetzt wissen wir, um welche Version es sich handelt, auf welchem Konto sie sich befindet und welche Instanz oder Maschine eine Aktion erfordert. Der Alarm-Responder kann dann schnell reagieren, alle zusätzlichen Informationen identifizieren, die nicht als Teil der Nutzlast gesendet werden, und das Problem viel schneller lösen.“

Teams schneller mobilisieren mit Response Plays

Hyland nutzte PagerDuty auch, um funktionsübergreifende Teams zusammenzustellen und zu mobilisieren, bei Bedarf weitere Fachexperten hinzuzuziehen und die Lösungszeiten weiter zu verkürzen. Antwortspiele , können Vorfallaktionen auf Knopfdruck ausgeführt werden, die auf Grundlage der vorkonfigurierten Eskalationsrichtlinien in PagerDuty direkt an das entsprechende Team weitergeleitet werden. Der Name jedes Response Play ist ausführbar, sodass der Benutzer genau weiß, was passiert, wenn er darauf klickt. „Alle Aktionen werden für den Vorfall verfolgt, sodass die Person, die sich meldet, weiß, was los ist“, sagte Long.

Vorteile von Intelligent Delivery

PagerDuty hat das Infrastrukturteam von Hyland erheblich beeinflusst und dazu beigetragen, eine ständig verfügbare Cloud-Umgebung für Kunden sicherzustellen. Das Team konnte unter anderem folgende Verbesserungen feststellen:

  • Weniger manuelle Prozesse und Mühe. Die Global Event Orchestration von PagerDuty AIOps verwendet eine leistungsstarke Entscheidungs-Engine, um den richtigen Helfern die richtigen Informationen zukommen zu lassen.
  • Aussagekräftigere Benachrichtigungen. PagerDuty AIOps   Benutzerdefinierte Variablen stellen sicher, dass die Informationen leicht verständlich sind und eine zeitnahe, genaue und umsetzbare Triage ermöglichen.
  • Schnellere Lösungszeiten. Reaktionsspiele helfen dabei, teamübergreifende Maßnahmen zusammenzustellen und zu mobilisieren, um komplexe Vorfälle zu bewältigen.

„Als wir uns unsere Probleme ansahen, stellten wir fest, dass wir Warnmeldungen hatten, die möglicherweise an verschiedene Teams weitergeleitet werden mussten. Die Warnmeldungen waren schlecht formatiert und wir hatten Hürden und Probleme, andere Teams zu erreichen“, sagte Long. „PagerDuty hat all das für uns gelöst.“

Sehen Sie sich Brians Summit '22-Sitzung an – Intelligente Bereitstellung und Mobilisierung von KMU: Sicherstellung einer effektiven Alarmverteilung und -behebung .

klicken Sie hier um mehr darüber zu erfahren, wie PagerDuty Unternehmen bei der Transformation ihrer digitalen Abläufe unterstützt und Starten Sie eine 14-tägige kostenlose Testversion Heute.