- PagerDuty /
- Der Blog /
- Veranstaltungsmanagement /
- Verwenden der Event Orchestration, um Lärm zu reduzieren und die nächstbeste Aktion auszulösen
Der Blog
Verwenden der Event Orchestration, um Lärm zu reduzieren und die nächstbeste Aktion auszulösen
Wir hören oft von Kunden, dass sie mit unkontrollierbaren Mengen an Rauschen und Komplexität zu kämpfen haben, was es schwieriger macht, die Grundursache zu ermitteln und schnell eine Lösung zu finden. All dieser Aufwand, der darauf verwendet wird, Rauschen zu durchforsten, Ereignisse zu verarbeiten und Kontext zu sammeln, führt zu viel Zeitverschwendung.
Aus diesem Grund haben wir Event Orchestration eingeführt, das am Montag für unsere Event Intelligence- und Digital Operations-Kunden allgemein verfügbar wurde.
Ich habe mich mit Frank Emery, Senior Product Manager für Event Orchestration bei PagerDuty, zusammengesetzt, um mehr Hintergrundinformationen zu dieser Funktion zu erhalten – warum wir sie entwickelt haben und wie er die Entwicklung anhand von Kundenverhalten und -feedback gesteuert hat.
F: Erzählen Sie mir etwas über die neue Funktion „Event Orchestration“ – welches Problem soll damit gelöst werden?
A: Als wir uns die PagerDuty -Plattform angesehen haben, haben wir festgestellt, dass 20 % der Vorfälle in fünf Minuten oder weniger gelöst werden. Kein schwerwiegender Vorfall, der schwer zu lösen ist, kann in fünf Minuten oder weniger gelöst werden. Das zeigt uns, dass es bei der Reaktion auf Vorfälle gut verstandene Prozesse gibt, wie das Ausführen von Diagnosetests oder das Neustarten eines Servers, die zwar notwendig, aber manuell sind und viel Zeit für die Teams in Anspruch nehmen, was wiederum die Produktivität und Konzentration beeinträchtigt. Dies sind die Arten von Anwendungsfällen, bei denen Sie mit präziser Automatisierung gezielt vorgehen können, um diese Schritte bei der Reaktion auf Vorfälle abzukürzen. In einigen Fällen könnten Sie sogar damit beginnen, Vorfälle von den Aufgaben der Mitarbeiter zu nehmen. Wenn Sie erwägen, diese Anwendungsfälle auf sich wiederholende Aufgaben auszuweiten, die zu Vorfällen mit Lösungszeiten von 15 oder 30 Minuten führen, wird das Potenzial für Zeiteinsparungen und die daraus resultierende Produktivität und Konzentration noch größer.
Das war unser Leitstern: Wie können wir unseren Kunden helfen, mithilfe unserer Plattform die Zeit zu reduzieren, die sie tatsächlich mit manuellen, sich wiederholenden Aufgaben verbringen müssen, die Teams bei jedem Vorfall erledigen müssen? Wie können wir Automatisierung einbauen, damit wir die Anzahl der leichter zu handhabenden Ereignisse reduzieren können, die die Einsatzkräfte treffen, damit sie ihre Zeit auf Vorfälle konzentrieren können, bei denen ihr Fachwissen tatsächlich benötigt wird?
Wenn wir an die Event-Orchestrierung denken: Wenn wir unseren Kunden mehr Flexibilität bei der Konfiguration von Regeln und die Möglichkeit geben, im Vorfeld mehr Automatisierungsfunktionen zu nutzen, könnten wir dann möglichst viele dieser gut verstandenen Aufgaben abdecken, bevor die Teams überhaupt benachrichtigt werden?
F: Was genau ermöglicht Ihnen die Event-Orchestrierung und worin besteht der Unterschied zu Event-Regeln?
A: Was wir tatsächlich getan haben, ist, Event Rules zu verwenden und eine Entscheidungs-Engine zu entwickeln, die direkt in der Event-Ingestion-Pipeline sitzt. Event Orchestration ermöglicht Ihnen die Verwendung einer neuen Bedingungssprache, die Sie mit komplexer Logik ausbauen, um die nächstbeste Aktion basierend auf Bedingungen in großem Maßstab auszulösen – in einigen Fällen ist es Unterdrückung, in anderen Routing, und einige Teams möchten Automatisierungsaktionen wie automatische Diagnosen oder automatische Korrekturen auslösen, während sie in Echtzeit aufgenommen werden.
Durch das Einrichten von Orchestrierungen zum Behandeln bestimmter Situationen basierend auf Bedingungen kann die Maschine mithilfe von Logik bestimmte Situationen identifizieren und basierend auf ihrem Erscheinungsbild bestimmen, wie damit umzugehen ist. Und dies öffnet die Tür für die Entscheidungsmaschine, sich um einige dieser Aufgaben zu kümmern, bevor überhaupt jemand eine Benachrichtigung erhält, und beginnt wirklich damit, den Vorfallreaktionsprozess für den Menschen zu verbessern, wenn dieser überhaupt benötigt wird.
F: Welche Anwendungsfälle sind für jemanden, der den Einsatz von Event Orchestration in Erwägung zieht, am einfachsten zu erreichen?
A: Wenn Sie an unsere Kunden denken, werden sie dies am häufigsten auf eine von zwei Arten nutzen.
Das erste ist die Rauschunterdrückung. Rauschen ist ein sehr, sehr häufiges Problem – keine Überraschung, wenn man an all die Tools denkt, die die Leute anschließen, um ihre Stapel zu überwachen, und wie sie alle Alarme senden. Wir haben andere Funktionen wie Deduplizierung und Unterdrückung oder ML-Optionen wie Intelligent Alert Grouping, um dabei zu helfen, aber einige unserer Kunden wollen es sehr präzise – und hier können insbesondere Ereignisregeln und Orchestrierung helfen. Wenn ein Benutzer Ereignisorchestrierung zur Rauschunterdrückung verwendet, kann er präzise Regelbedingungen verwenden, um eine ganze Reihe sehr gezielter Situationen einzurichten, in denen Sie Rauschen für Ihre Teams ablenken, konsolidieren oder unterdrücken können, um nur die kritischen Signale durchzulassen.
Der zweite Aspekt ist die Automatisierung. Wie ausgefeilt diese wird, hängt von der operativen Reife ab. Es besteht ein großes Potenzial, einige der frühen Phasen der Reaktion auf Vorfälle zu automatisieren, viele der Schritte sind jedoch sehr repetitiv.
Denken Sie an Ihren am stärksten frequentierten Dienst und überlegen Sie, wie viele der Vorfälle bei diesem Dienst dieselben anfänglichen Diagnoseschritte erfordern. Wir hören es ständig von Technikern: Immer wenn es zu einem Ausfall kommt, werden sie angerufen und dann gibt es diese Schritte, die sie jedes Mal ausführen müssen, bevor irgendjemand etwas tun kann, um das Problem zu lösen. Normalerweise sind das Dinge wie das Ausführen von Skripts und das Sammeln von Informationen, um den richtigen Kontext herauszufinden – alles wichtig, aber sie sind nicht einzigartig für den Vorfall und Sie können nichts damit anfangen, bis Sie Ergebnisse zurückbekommen. Die Automatisierung der Diagnose ist in diesem Szenario die perfekte Lösung, um mit der Automatisierung dieser bekannten, sich wiederholenden Aufgaben zu beginnen, die in vielen Szenarien erforderlich sind.
—
Möchten Sie mehr erfahren? Weitere Informationen zur Event Orchestration finden Sie unter Wissensbasis Artikel oder durch Sehen Sie sich die Demo hier an .
Waren auch Hosten eines Webinars am 15. Februar, wo Sie Frank Emery, Senior Product Manager bei PagerDuty, zuhören können, der Ihnen einen Überblick über die neue Funktion gibt, gängige Anwendungsfälle aus unserem Early Access-Programm vorstellt und eine Demo zeigt. Egal, ob Sie Ihre Automatisierung verbessern, Eventmanagement-Tools konsolidieren oder einfach nur komplexere Eventregeln verwenden möchten, Sie sollten diese Sitzung nicht verpassen. Hier registrieren .