Der Blog

4 neue Möglichkeiten zur Verbesserung des Vorfallmanagements mit Event Orchestration

von Hannah Culver 11. September 2024 | 5 Minuten Lesezeit

In einer Zeit, in der Effizienz und intelligente Technologieintegration von entscheidender Bedeutung sind, 71 % der technischen Führungskräfte berichten, dass ihre Unternehmen in diesem Jahr ihre Investitionen in künstliche Intelligenz (KI) und maschinelles Lernen (ML) ausweiten. Angesichts der enormen Datenmenge, die in das Unternehmen eingeht, und der Notwendigkeit einer zeitnahen Reaktion ist es unpraktisch, jede eingehende Warnung rund um die Uhr zu überwachen, und menschliche Wachsamkeit allein ist zu ungenau. Stattdessen kann die Nutzung datengesteuerter Vorhersagen, die auf der historischen Funktionsweise Ihres Systems basieren, einen effektiveren Ansatz zur Verwaltung und Reaktion auf Vorfälle bieten. Hier kommt die Event Orchestration von PagerDuty ins Spiel.

Event Orchestration unterstützt Unternehmen dabei, indem es eine durchgängige ereignisgesteuerte Automatisierung schafft. Diese Funktion verbessert die Erkennung von Vorfällen, die schnellere Korrelation von Grundursachen und die Skalierung Betriebsreife über technische Teams hinweg, damit diese kohärenter und effektiver zusammenarbeiten können.

Mit Event Orchestration-Variablen können Teams intelligente Automatisierungen erstellen, die sich nahtlos in andere Tools und Prozesse integrieren lassen und so eine gezieltere Reaktion auf Vorfälle ermöglichen, die unternehmensweit standardisiert werden kann. Diese neue Event Orchestration-Funktion hilft Ihnen, aus vergangenen Vorfällen zu lernen und deren Wiederholung zu verhindern. Das Ergebnis ist eine proaktivere Haltung im Betrieb mit skalierbaren und wiederholbaren Ergebnissen, die dem gesamten Technologie-Ökosystem zugute kommen.

Global Orchestration

Lassen Sie uns vier Möglichkeiten durchgehen, wie Sie diese neue Funktion heute nutzen können.

1. Automatisierung des Großschadensmanagements

Die meisten Organisationen behandeln schwerwiegende Vorfälle anders als Vorfälle mit niedrigerer Priorität. Ein schwerwiegender Vorfall kann andere Eskalationspfade, Arbeitsabläufe und interne Prozesse erfordern. Daher ist die Automatisierung bei schwerwiegenden Vorfällen oft maßgeschneiderter.

Mithilfe von Event Orchestration-Variablen können Teams jetzt schwerwiegende Vorfälle vorhersagen und die Art und Weise der automatisierten Bewältigung des Vorfalls modulieren. Sie können beispielsweise einen Schwellenwert für Ereignisse definieren, der die richtigen Prozesse für schwerwiegende Vorfälle auslöst, wenn die Ereigniskriterien mit dem übereinstimmen, was Sie als Anzeichen für einen schwerwiegenden Vorfall kennen. Event Orchestration behandelt nicht jedes Ereignis als eine einzigartige, separate Instanz. Stattdessen werden Ereignisse als historische Grundlage verwendet, um fundierte Entscheidungen über den Zustand des Systems im Laufe der Zeit zu treffen.

Event Orchestration variables

Dieser neue Ansatz unterscheidet sich von herkömmlichen Ansätzen, bei denen schwerwiegende Vorfälle automatisiert ausgelöst werden. Anstatt ein einzelnes Ereignis als Anzeichen für einen schwerwiegenden Vorfall zu betrachten, können Sie den Zustand Ihres Systems genauer bewerten, indem Sie wissen, was kürzlich passiert ist und wie genau die Umstände mit früheren schwerwiegenden Vorfällen übereinstimmen.

2. Reaktive Automatisierung

Viele Organisationen verlassen sich auf automatisierte Diagnosen oder automatische Abhilfemaßnahmen, um den Reaktionskräften einen Vorsprung zu verschaffen. Die Automatisierung ist jedoch nicht selbstbewusst. Sie weiß nicht, was bereits für andere Ereignisse ausgeführt wurde, die kürzlich in das System gelangt sind. Daher versucht die Automatisierung oft, mehrere Male für ähnliche Ereignisse ausgeführt zu werden, ohne tatsächlich echte Erkenntnisse oder Lösungen für das Problem zu liefern.

Jetzt können Sie eine Automatisierung erstellen, die nachverfolgt, ob Diagnosen ausgeführt wurden, und Automatisierungspfade basierend auf der Antwort ändern. Wenn beispielsweise kürzlich eine Diagnose für eine Event Orchestration ausgeführt wurde, erkennt die Automatisierung, dass die Diagnose nicht erneut ausgeführt werden muss. Und sie startet eine zusätzliche Automatisierungssequenz wie die automatische Behebung.

End to End platform for event-driven automation chart.

Diese reaktive Automatisierung (oder Automatisierung, die auf intelligente Weise weitere Automatisierung auslöst) gibt Unternehmen mehr Flexibilität und Kontrolle darüber, wann die Automatisierung erfolgt und was mit dem Feedback aus diesen Sequenzen zu tun ist.

3. Dynamische Automatisierung

Unternehmen möchten die Automatisierung auf fundierte Weise ausführen und gezielt die genau ausgefallene Anwendung oder Infrastruktur ansprechen. Wenn Sie jedoch nur auf ein einzelnes Ereignis zugreifen können, ist es schwierig herauszufinden, welcher Teil Ihres Stacks ausgefallen ist, und die Automatisierung entsprechend auszuführen.

Mithilfe der Event Orchestration können Sie Informationen darüber extrahieren und speichern, in welchen Teilen Ihres Stacks Probleme aufgetreten sind. So können Sie diese Informationen für eine präzisere Ausrichtung in die zukünftige Automatisierung einfließen lassen.

New Cache Variable

Sie können beispielsweise eine Variable festlegen, die Daten aus einer Nutzlast extrahiert. Wenn die Ereignisnutzlast mit einem bestimmten Umstand übereinstimmt, z. B. einem Kubernetes-Ereignis, können Sie die Knoteninformationen auffüllen. Anschließend können Sie eine Automatisierungssequenz erstellen, um genau diesen ausgefallenen Knoten zu identifizieren und dynamisch neu zu starten.

4. Selbstkonfigurierende Automatisierung

Wenn etwas schief geht, reicht eine grobe Schätzung des Problems nicht aus. Die Einsatzkräfte müssen sofort über die richtigen Triage-Informationen verfügen, um die Grundursache zu ermitteln und die Lösung schnellstmöglich in die Wege zu leiten.

In diesen Fällen können Variablen Organisationen dabei helfen, sofort die richtigen Triage-Informationen zu erhalten und Fehler in einem System mit Automatisierung zu lokalisieren, das sich während des gesamten Reaktionsprozesses selbst konfiguriert. Wenn sich ein Ereignis beispielsweise auf einen Teil der Infrastruktur bezieht, bei dem derzeit ein Problem auftritt, konfiguriert die Automatisierung die Regel und fügt wichtigen Kontext wie Notizen hinzu.

Diese neue Funktion macht die Automatisierung innerhalb von PagerDuty skalierbarer und bringt Informationen so schnell wie möglich an die Oberfläche. Sie reduziert nicht nur die Zeit, die zum Beheben von Vorfällen benötigt wird, sondern auch zum Erstellen und Bereitstellen von Automatisierung in einem komplexen technischen Ökosystem.

Wenn Sie bereits PagerDuty AIOps-Kunde sind und an einer solchen Automatisierung interessiert sind, sehen Sie sich das hier an. Kurze Anleitung oder Twitch-Demo von Principal Product Manager Frank Emery .

Kein PagerDuty AIOps-Kunde? Probieren Sie es noch heute aus und erstellen Sie ereignisgesteuerte Automatisierung, die Ihnen dabei hilft, den Arbeitsaufwand zu reduzieren und die Effizienz im gesamten Unternehmen zu verbessern.