• PagerDuty
    /
  • Der Blog
    /
  • AIOps
    /
  • Was ist Event Orchestration? 7 Möglichkeiten, diese leistungsstarke neue Funktion von PagerDuty zu nutzen, um Lärm zu reduzieren und manuelle Arbeit noch heute zu automatisieren

Der Blog

Was ist Event Orchestration? 7 Möglichkeiten, diese leistungsstarke neue Funktion von PagerDuty zu nutzen, um Lärm zu reduzieren und manuelle Arbeit noch heute zu automatisieren

von Vivian Chan 2. August 2022 | 9 min lesen

Hat Ihr Team mit zu viel Lärm zu kämpfen? Ist Ihnen das Herz schwer, wenn Sie daran denken, wie sehr sich Ihre Regelsätze ausgebreitet haben, um Ihre Anforderungen an die Ereignisverarbeitung zu erfüllen? Aus diesem Grund haben wir Ereignisorchestrierung Anfang des Jahres, um Teams dabei zu helfen, den manuellen Arbeitsaufwand im Eventmanagement zu reduzieren. Event Orchestration ist die nächste Entwicklungsstufe unseres Event Rules-Funktionssatzes, der dabei hilft, Events bei der Aufnahme zu routen, anzureichern und zu ändern, um Störungen zu beseitigen und Prozesse zu automatisieren.

Wir haben Event Rules erweitert, um komplexere, benutzerdefinierte Logik und anspruchsvollere Funktionen zur Verarbeitung bedingter Ereignisse zu verarbeiten. Wir haben sogar unsere eigene Bedingungssprache geschrieben ( PagerDuty Bedingungssprache oder PCL, ausgesprochen „Pickle“), um dies zu ermöglichen – wie wir es gebaut haben, erfahren Sie in der Summit-Sitzung „PCL 101“ von Staff Engineer Barry Kim. Hier .

Ereignisorchestrierung ist jetzt die beste Möglichkeit für Benutzer, Regelmengen zu komprimieren, die Rauschunterdrückung zu verbessern und gut verstandene manuelle Arbeit effektiver zu automatisieren. Wir haben kürzlich angekündigt, dass wir, um sicherzustellen, dass wir unsere Ressourcen dem Aufbau der robustesten und zuverlässigsten ereignisgesteuerten Anreicherungs- und Automatisierungserfahrung für unsere Kunden widmen, Anfang nächsten Jahres Event Rules beenden und alle Kunden auf Event Orchestration migrieren werden. Weitere Informationen hierzu und zu den verschiedenen Migrationsoptionen , wir haben alles in diesem Knowledge Base-Artikel .

In diesem Blog erkläre ich, wie sich Event Orchestration von Event Rules unterscheidet und gehe auf sieben gängige Anwendungsfälle für Event Orchestration ein, die unserer Erfahrung nach für unsere Kunden die größte Wirkung haben.

Was ist Event-Orchestrierung? Und worin besteht der Unterschied zu Event-Regeln?

Ereignisorchestrierung ist ein direktes Upgrade von Event Rules. Basic Event Orchestrations können dieselben grundlegenden Event-Verarbeitungsaktionen ausführen wie Event Rules, mit den zusätzlichen Vorteilen einer verbesserten Benutzeroberfläche, besserer Regelerstellung, APIs und Terraform-Unterstützung sowie erweiterten Bedingungen. Für Kunden mit dem Event Intelligence-Add-on oder Digital Operations-Plänen bieten Advanced Event Orchestrations noch mehr Funktionalität, darunter kontextbezogene Bedingungen, Webhooks, angehaltene Vorfallbenachrichtigungen, Regelverschachtelung und eine direkte Integration mit Automation Actions.

Im Folgenden sind einige der wichtigsten Punkte aufgeführt, in denen Event Orchestration Event Rules überlegen ist:

  • Einfacher zu verwenden: Architektonisch profitiert Event Orchestration von PagerDutys modernerem Ansatz zur Frontend-Entwicklung, indem es React als zentralen Frontend-Stack nutzt. Dies ermöglicht es Kunden, ihre Regeln mit weniger Verzögerungen zu navigieren und bietet künftig mehr Unterstützung für Verbesserungen der Zugänglichkeit.
  • Komplexere Ereignisverarbeitung: Dank der von Event Orchestration unterstützten Bedingungssprache und der Möglichkeit, Regeln zu verschachteln, können Kunden, die Event Orchestration verwenden, komplexe Ereignisverarbeitungsaktionen mit einem Bruchteil des Konfigurationsaufwands durchführen. Was früher mit 10 Ereignisregeln erreicht werden konnte, lässt sich jetzt mit einer Event Orchestration-Regel erledigen.
  • Robustere Unterstützung für die Automatisierung: Benutzer können Webhooks mit benutzerdefinierten Headern oder Automatisierungsaktionen auslösen.
  • Präzisere Ereignisverarbeitung: Durch die Verschachtelung von Regeln können Benutzer Automatisierungen mit einem hohen Maß an Präzision ausführen, da Kunden jeden bekannten Fehlerstart für ihre Systeme detailliert auflisten und die Automatisierung für jeden einzelnen Schritt zuverlässig bereitstellen können.

Was sind die häufigsten Anwendungsfälle für Event-Orchestrierung?

Angesichts all dieser zusätzlichen Funktionen ist hoffentlich klar, dass Event Orchestration das Potenzial hat, die Erfahrung Ihres Teams im Rahmen der Reaktion auf größere und kleinere Vorfälle erheblich zu verbessern. Aber wo sollten die Leute anfangen?

Eine der beliebtesten Sitzungen in unserer On-Demand-Videobibliothek auf dem Summit 2022 war „7 Möglichkeiten, Event Orchestration zu nutzen, um Lärm zu reduzieren und häufiger zu automatisieren“. In der Sitzung geht der Professional Services Consultant Eddie Willits zusammen mit Senior Product Manager Frank Emery durch Event Orchestration und die häufigsten Anwendungsfälle, in denen Kunden die leistungsstarke neue Funktion nutzen. Ich habe sie unten zusammengefasst, aber wenn Sie ein audiovisueller Lerner sind, können Sie sich auch deren schnelle 20-minütige Sitzung .

Hier sind die 7 häufigsten Anwendungsfälle für Event Orchestration heute:

1) Unterdrückung

Das Problem mit Lärm ist, dass er sehr ablenkt. Besonders ärgerlich ist er, wenn es sich nicht einmal lohnt, mit der Arbeit aufzuhören, um ihn anzusehen. Klassische Beispiele hierfür sind Ereignisse aus einer Staging-Umgebung oder nicht kritische Entwicklungsereignisse, die nach Feierabend gesendet werden. Wie können Sie sicherstellen, dass Ihr Team nur an den wichtigen Vorfällen arbeitet?

Mithilfe der Event Orchestration können sich Teams auf kritische Ereignisse konzentrieren, indem die Einsatzkräfte nur durch die wichtigsten, zeitkritischen Warnungen unterbrochen werden. Sie können eine Orchestrierung entwerfen, die nach einem bestimmten Typ von Signalen mit niedriger Priorität sucht, und eine Orchestrierung konfigurieren, die die Pause Incident Notification von PagerDuty aufruft, um irrelevante, wenig wertvolle oder störende Ereignisse zu verarbeiten, indem sie automatisch herabgestuft oder vollständig unterdrückt werden. Anstatt Zeit mit der Bestätigung störender Ereignisse zu verbringen, können sich die Einsatzkräfte auf kritische Warnungen konzentrieren, die das Geschäft betreffen.

2) Automatisierte Wartungsfenster

Wie oft denken Sie: „Heute Nacht führe ich Wartungsarbeiten durch! Wie stelle ich sicher, dass die Dienstbesitzer nicht geweckt werden?“

Event Orchestration hilft bei diesem Anwendungsfall mit der Möglichkeit, benutzerdefinierte Logik zu erstellen, die wiederkehrende oder geplante Regelbedingungen berücksichtigt. Kunden können definieren, wann alle Warnungen unterdrückt oder umgeleitet werden sollen, um ein laufendes oder geplantes Wartungsfenster zu unterstützen. Sie können sogar noch spezifischer vorgehen als ein pauschales Wartungsfenster pro Dienst, indem Sie Regeln einrichten, die unterschiedliche Möglichkeiten zur Behandlung jeder Warnung durch das Überwachungstool bieten. Ein Beispiel, das wir bei Kunden hierfür gesehen haben, wäre die Konfiguration einer Orchestrierung, die den Schweregrad nach Feierabend für produktionsumgebungsspezifische Ereignisse anpassen kann, die mit Bereitschafts- und Ruhezeiten zusammenfallen.

HINWEIS: Wir werden oft gefragt, was mit den Alarmen passiert, wenn sie in den Wartungsmodus versetzt werden. Ereignisse, die in PagerDuty eingehen, sind immer zur Referenz sichtbar, auch wenn sie unterdrückt werden. Diese können im Menü „Alarme“ angezeigt werden.

3) Kontrolle von Alarmstürmen

Niemand möchte mit einem Alarmsturm konfrontiert werden. Aber es gibt sie. Die Frage ist, wie Sie die Erfahrung Ihres Teams steuern können, wenn es während eines teilweisen oder vollständigen Ausfalls dazu kommt, sodass die Störungen so gering wie möglich sind und sich das Team auf die wichtigste Aufgabe konzentrieren kann: die Behebung des Problems.

Mit Event Orchestration können Kunden schwellenwertbasierte Regeln verwenden, um das Verhalten bei der Vorfallerstellung während einer Alarmsturmwelle zu steuern. Sie können schwellenwertspezifische Regeln konfigurieren, um Aktionen auszulösen, die bis zu einem bestimmten Schwellenwert ausgeführt werden oder die nach Überschreiten eines bestimmten Schwellenwerts ausgeführt werden. Dies gibt Ihnen noch mehr Präzision bei der Ereignisanreicherung, -weiterleitung oder -gruppierung im Verhältnis zum Ereignisvolumen.

4) Routing und Anreicherung

Bei der Fehlerbehebung müssen Einsatzkräfte schnell verstehen können, was während eines Ausfalls passiert ist. Wie können Sie diese Informationen bei einem Vorfall besser hervorheben, damit Einsatzkräfte keine Zeit mit der Suche danach verschwenden?

Event Orchestration kann Kunden durch einen automatisierten Ansatz bei der Standardisierung von Vorfalldaten unterstützen, indem:

  • Überschreiben fehlerhafter Felder
  • Ersetzen von Feldern basierend auf bekannten Anwendungsfällen
  • Aktualisierung der Schwere/Priorität/Dringlichkeit
  • Anpassen des Vorfallerstellungsverhaltens (E-Mail-Integration)

Sie könnten beispielsweise eine Orchestrierung einrichten, bei der jedes Mal, wenn ein Ereignis die Nutzlast „Reaktionszeit ist hoch“ enthält und über 1000 ms liegt, der Vorfall sofort als Priorität 1 gekennzeichnet wird.

5) Bereitstellung von Runbooks

Immer wenn jemand Neues in Ihr Team eintritt, insbesondere wenn es sich um einen Neuling handelt, dauert es eine Weile, ihn in die spezifischen Ansätze Ihrer Vorfallreaktionsprozesse einzuarbeiten. Es braucht Zeit, um zu erklären und zu schulen, wie man selbst bei gut verstandenen, häufigen Vorfällen vorgeht. Eine der grundlegendsten Formen der Automatisierung, die unsere Kunden zur Lösung dieses Problems anwenden, besteht darin, zunächst aufzuschreiben, wie sie diese Probleme in Runbooks lösen, die als bewährte Methoden zur Bewältigung wiederkehrender Probleme weitergegeben werden können.

Event Orchestration erleichtert das Hinzufügen von Notizen, die Links zu Runbooks oder Lösungsanweisungen für bekannte Probleme enthalten. Auf diese Weise ist das Runbook beim Einstufen des Vorfalls und beim Betrachten der Warnmeldungsnutzlast leicht als Referenz zugänglich. Das Einbetten dieser verwertbaren Informationen während der Ereignisverarbeitung bei der Aufnahme bedeutet, dass L1-Responder häufige, gut verstandene Probleme problemlos lösen können, ohne sie an leitende Ingenieure weiterleiten zu müssen.

6) Aktualisierung der Aufzeichnungssysteme

Kunden, die spezielle ITSM-Tools für größere und kleinere Vorfälle verwenden, werden sich dafür interessieren, wie sie ihr Aufzeichnungssystem mit ihren PagerDuty Vorfällen synchron halten können.

Mit Event Orchestration-Webhooks können Benutzer sicherstellen, dass bei der Aufnahme von Vorfällen die verbundenen Systeme aktualisiert werden. Bestimmte Regeln enthalten Webhooks, die Payloads an diese Systeme senden, die Datensätze mit aktuellen Event-Payload-Informationen erstellen. Wir haben gesehen, dass dies mit Jira, ServiceNow und selbst entwickelten CMDB-Systemen verwendet wird. Erfahren Sie mehr über die Integration von PagerDuty mit ITSM-Lösungen Hier .

7) Automatisierte Diagnose und Behebung

Jeder möchte mit der Automatisierung seiner Betriebsabläufe beginnen. Das ist nicht überraschend: Mit Vorfällen sind VIELE manuelle Schritte verbunden. Es kann jedoch schwierig sein zu wissen, wo und wie man beginnen soll.

Automatisierte Diagnosen sind eine risikoarme und wertvolle Möglichkeit, die MTTR-Zeit zu verkürzen. Denken Sie an all die Diagnosen, die Sie zu Beginn einer Untersuchung durchführen müssten. Stellen Sie sich nun vor, diese wären bereits durchgeführt, wenn Ihr Einsatzteam den Vorfall bekäme.

Event Orchestration vereinfacht die Integration von Automatisierungstools über Webhooks. Es verfügt außerdem über eine integrierte native Integration mit PagerDuty Automation Actions, die automatische Diagnosen und Abhilfemaßnahmen auf der PagerDuty Plattform auslösen kann. Dies trägt dazu bei, die Gesamtzeit bis zur Lösung zu verkürzen, da Diagnoseergebnisse direkt in die Vorfalldetails einfließen und für den Responder zur Überprüfung bereitstehen.

Erfahren Sie mehr über Event Orchestration

Lesen Sie mehr über Ereignisorchestrierung oder schauen Sie sich einige unserer Videos auf Youtube an, darunter Ereignisorchestrierung in Terraform Und Spaß und Mathematik hinter der Event-Orchestrierung .

Weitere Informationen zur Erweiterung der Event Orchestration auf mehrere Dienste finden Sie unter dieser Blog über Global Event Orchestration oder Unsere Produkttour .