- PagerDuty /
- Der Blog /
- Automatisierung /
- Automatisieren Sie das Management schwerwiegender Vorfälle Schritt für Schritt für eine bessere und schnellere Reaktion
Der Blog
Automatisieren Sie das Management schwerwiegender Vorfälle Schritt für Schritt für eine bessere und schnellere Reaktion
Unternehmen, die den Markt erobern und großartige Kundenerlebnisse schaffen wollen, müssen ihr Versprechen eines außergewöhnlichen Services erfüllen, also weniger Unterbrechungen und eine schnellere Lösung. Dies lässt sich erreichen, indem bei schwerwiegenden Vorfällen Automatisierung in den gesamten Incident-Management-Lebenszyklus integriert wird und wo sinnvoll menschliche Hilfe hinzugezogen wird.
Lassen Sie uns einige der Schritte im Vorfallmanagement durchgehen, die sich für die Automatisierung eignen, um unmittelbare Vorteile zu erzielen, entweder um menschliches Eingreifen überflüssig zu machen oder um sie in kritischen Momenten zu unterstützen.
Bevor Sie es merken, gibt es einen Vorfall
Bevor die Einsatzkräfte wissen, dass ein Vorfall passiert, besteht eine großartige Gelegenheit, Maschinen die Hauptarbeit über ereignisgesteuerte Automatisierung zu überlassen. Ereignisgesteuerte Automatisierung beginnt auf Ereignisebene, wenn Daten aus vertrauenswürdigen Quellen wie Überwachungstools aufgenommen werden. An diesem Punkt kann die Automatisierung mehrere Dinge tun, um sicherzustellen, dass das Vorfallmanagement effizient und mit so wenig Unterbrechungen für KMU wie möglich abläuft. Einige davon sind:
- Reduzierung der Vorfallshäufigkeit: Wenn ein Helfer sofort auf ein Problem reagieren muss, kann es ärgerlich und störend sein, mehrere Male über dasselbe Problem benachrichtigt zu werden. Darüber hinaus erschwert es die Konzentration und verlangsamt die Reaktionszeit. Durch die Verwendung von KI und Automatisierung zum Gruppieren von Benachrichtigungen für verwandte Probleme in demselben Vorfall wird dieser Lärm rationalisiert, sodass sich die Helfer auf das vorliegende Problem konzentrieren können.
- Reduzierung der Ereignislautstärke für ein besseres Signal-Rausch-Verhältnis: Doppelte, informative oder flüchtige Ereignisse können für die Antwortenden verwirrend sein, sodass es schwierig wird, zu erkennen, was wichtig ist und was nicht. Durch die Reduzierung der Lautstärke wird sichergestellt, dass nur die wichtigsten Ereignisse angezeigt werden.
- Bereitstellen von Kontext aus Ereignisdaten: Ereignisse können je nach den Diensten, auf die sie sich beziehen, sehr unterschiedlich aussehen und enthalten nicht immer hilfreiche Informationen, die für die Einsatzkräfte leicht verdaulich sind. Mithilfe der Automatisierung können diese Ereignisse mit wichtigen Informationen angereichert und unternehmensweit standardisiert werden, sodass alle Einsatzkräfte den Kontext verstehen. Darüber hinaus können Organisationen benutzerdefinierte Felder verwenden, um noch mehr Kontext hinzuzufügen, z. B. indem Vorfälle anhand eingehender Daten sofort als „schwerwiegend“ oder „Produktion“ gekennzeichnet werden. Tatsächlich ist diese Funktionalität jetzt verfügbar in Früher Zugang .
- Bereitstellung eines automatischen Diagnosekontexts: Die Durchführung von Diagnosen ist häufig eine manuelle Aufgabe, die die Einsatzkräfte bei jedem Vorfall erledigen. Aber wir müssen dafür keine Kapazitäten verschwenden. Stattdessen kann die Automatisierung Diagnosen anstoßen und sie ausfüllen, bevor ein Einsatzkraft den Vorfall überhaupt untersucht.
- Automatische Korrektur: Laut unseren Kunden können etwa 15 % der Vorfälle ohne menschliches Eingreifen gelöst werden. Diese bekannten Probleme können vollständig automatisiert behoben werden, was Zeit spart und die Auswirkungen auf den Kunden reduziert. In vielen Fällen arbeitet die Automatisierung schnell genug, sodass die meisten Kunden einen Vorfall überhaupt nicht bemerken.
Nachdem diese Aufgaben automatisiert erledigt wurden, werden die verbleibenden Vorfälle, die nicht gelöst werden können, zur Sichtung an den richtigen KMU – häufig den Dienstbesitzer – weitergeleitet.
Während der Triage
Triage ist die Phase, in der der Helfer versucht, herauszufinden, was schiefgelaufen ist. Aber Systeme sind komplex und die Antwort ist oft nicht einfach, sodass dieser Prozess oft viel Zeit und geistige Kapazität in Anspruch nehmen kann. In der Zwischenzeit warten die Kunden darauf, dass der Service wieder normal funktioniert. Es ist wichtig, dass die Helfer ihr Fachwissen sinnvoll einsetzen können, um das Problem genau zu lokalisieren, anstatt sich durch Dokumente und Post-Mortem-Analysen zu wühlen oder andere KMU anzupingen, um Einblicke in Stammeswissen zu erhalten und herauszufinden, was schiefgelaufen ist. Dank maschinellem Lernen und automatisierter Diagnose ist ein Großteil dieser Vorarbeit bei einem Vorfall bereits erledigt, sobald die Helfer an ihren Schreibtischen eintreffen.
Maschinelles Lernen kann den Systemkontext für die Einsatzkräfte ans Licht bringen, etwa den wahrscheinlichen Ursprung des Vorfalls, andere Teams, bei denen das gleiche Problem aufgetreten ist, vergangene Vorfälle und deren Lösung, Änderungsereignisse und mehr.
Mit diesen Informationen ausgestattet, können Einsatzkräfte schnell handeln und sich über Vorfälle informieren, ohne sich mit der Informationsbeschaffung herumschlagen zu müssen. Dadurch stehen allen Einsatzkräften Informationen zur Verfügung, unabhängig davon, ob sie bereits seit zehn Jahren in der Organisation sind und alles über das System wissen oder gerade erst angefangen haben.
Während wir an einer Lösung arbeiten
Die Arbeit an einer tatsächlichen Lösung eines Problems ist der Teil der Reaktion, der von KMU am meisten gefordert wird. An diesem Punkt dient die Automatisierung als Assistent, der Fragen mithilfe von KI beantworten und Arbeitsabläufe für das Reaktionsteam optimieren kann, damit alles kodifiziert und auf Kurs bleibt. Lassen Sie uns über jeden dieser Punkte sprechen.
GenAI hat für viele Unternehmen den entscheidenden Unterschied gemacht. Aber wie Sie es verwenden, macht den Unterschied. Ein wichtiger Faktor bei der Verwendung von GenAI ist die Möglichkeit, Fragen zu stellen und mit der KI zu interagieren, um schnell die gewünschten Antworten zu erhalten. Mit GenAI-Chatbots, die das Vorfallmanagement unterstützen, können Sie die Kapazität Ihres Teams erhalten, indem Sie ihm Fragen zum System stellen, um einen Ausgangspunkt, eine Vorstellung von den Auswirkungen und mehr zu erhalten.
Kombiniert mit einem KI-Copilot , Incident Workflows können ebenfalls bahnbrechend sein. Die Einsatzkräfte haben nicht nur Antworten auf wichtige Fragen direkt zur Hand, sie wissen auch, was als Nächstes zu tun ist, und mühsame Schritte wie das Erstellen von Kommunikationskanälen, das Verfassen von Updates und mehr werden für sie erledigt.
Bei der Kommunikation sowohl intern als auch extern
Apropos Updates: Kommunikation ist ein wichtiger Teil des Vorfallmanagements, kann aber in der Hitze eines Vorfalls leicht untergehen. Effektive Kommunikation umfasst intern mit wichtigen Stakeholdern, extern mit Kunden und mit anderen Systemen wie Ihrem ITSM. Es ist wichtig, Automatisierung und GenAI gemeinsam zu nutzen, um alle Grundlagen abzudecken und maßgeschneiderte Kommunikation für jedes Publikum zu erstellen.
Dies kann den Helfern auf verschiedene Weise gelingen:
- Benutzerdefinierte Felder : Schreiben Sie Updates zurück an Ihr ITSM und aktualisieren Sie den Vorfall mit allen relevanten ITSM-Daten, damit alle Teams, ob IT oder Entwickler, auf dem gleichen Stand sind.
- Vorlagen für Statusaktualisierungen: Verwenden Sie GenAI, um Updates zu erstellen und diese basierend auf vorgefertigten Gruppen automatisch an wichtige interne Stakeholder zu veröffentlichen.
- Statusseiten: Informieren Sie die Kunden automatisch darüber, was sie von den Reaktionsbemühungen erwarten können, und teilen Sie ihnen mit, wenn ein Vorfall abgeschlossen ist.
Kommunikation während des gesamten Vorfalls hilft, Vertrauen aufzubauen und zu bewahren. Die Einsatzkräfte müssen möglicherweise eine frühzeitige Bestätigung, regelmäßige Updates und dann eine abschließende Antwort senden. Durch Automatisierung über Vorfall-Workflows können die Einsatzkräfte auf dem Laufenden bleiben, sodass von der Bestätigung eines Vorfalls bis zur Lösung niemand außen vor bleibt.
Nutzung von KI und Automatisierung
Der Einsatz von KI und Automatisierung während des gesamten Vorfalllebenszyklus kann die Erfahrung für Einsatzkräfte, Stakeholder und Kunden verbessern. Es ist wichtig, diese neuen Arbeitsweisen zu übernehmen und an der Spitze dieser neuen Technologie zu stehen. Es ist jedoch unwahrscheinlich, dass Maschinen auf lange Sicht in der Lage sein werden, neuartige Probleme selbst zu lösen. In der Zwischenzeit ist es wichtig, einen strategischen Partner zu haben, der Unternehmen dabei hilft, KI und Automatisierung optimal zu nutzen. Wenn Sie erfahren möchten, was PagerDuty für Sie tun kann, Probieren Sie uns noch heute aus .