• PagerDuty
    /
  • Der Blog
    /
  • Merkmale
    /
  • Reduzieren Sie die MTTR und bringen Sie die Automatisierung auf ein neues Niveau mit PagerDuty Global Event Orchestration

Der Blog

Reduzieren Sie die MTTR und bringen Sie die Automatisierung auf ein neues Niveau mit PagerDuty Global Event Orchestration

von Hannah Culver 18. April 2023 | 5 Minuten Lesezeit

PagerDutys Global Event Orchestration ist jetzt allgemein verfügbar. Die leistungsstarke Entscheidungs-Engine von Global Event Orchestration bereichert Ereignisse, steuert deren Weiterleitung und löst auf der Grundlage von Ereignisdaten selbstheilende Aktionen aus. Teams können diese Funktionalität für alle oder einzelne Dienste innerhalb von PagerDuty nutzen. Diese Funktion ist eine kontinuierliche Investition in Event Orchestration und zeigt PagerDutys Engagement, Kunden erstklassige Automatisierungsfunktionen bereitzustellen.

Kunden in unserem Early-Access-Programm erkennen bereits den Wert von Global Event Orchestration und loben die reduzierte MTTR und die bessere Standardisierung der Reaktion auf Vorfälle im großen Maßstab. Kiril Yurovnik, Technical Lead bei Riskified, sagte: „Angesichts der wachsenden Zahl von Ereignissen ist es unerlässlich, Lärm und Aufwand zu minimieren, insbesondere da Unternehmen ihre IT-Prozesse im aktuellen wirtschaftlichen Umfeld optimieren möchten. Wir haben Global Event Orchestration von PagerDuty im Rahmen des Early-Availability-Programms verwendet und die Ergebnisse waren überzeugend. Riskified konnte die Lärmreduzierung skalieren, insbesondere in Nicht-Produktionsumgebungen, wodurch unser Team wertvolle Zeit sparte, die es in die Innovation der nächsten Schritte investieren konnte.“

Was sind globale Ereignisorchestrierungen?

Global Event Orchestration ist wie Service-Event-Orchestrierung indem es Benutzern ermöglicht, komplexe Regeln zu definieren, die bestimmen, was mit einem Ereignis während seiner Verarbeitung geschieht. Der Unterschied besteht darin, dass Global Event Orchestration Ereignisse bei der Aufnahme anreichert. Sobald die Daten normalisiert sind, wird das Ereignis basierend auf verschiedenen Kriterien an einen Dienst weitergeleitet. Dadurch wird sichergestellt, dass die Antwortenden über die bestmöglichen Ereignisdaten verfügen, um den Antwortprozess zu starten.

Global Event Orchestration verfügt über drei Schlüsselkomponenten, die eine erfolgreiche Skalierung der Reaktion auf Vorfälle ermöglichen.

Globale Orchestrierungsregeln ermöglichen es Benutzern, Aktionen auf Ereignisse dienstübergreifend anzuwenden. Teams können Regeln erstellen, die Ereignisdaten dienstübergreifend verarbeiten und die verarbeiteten Daten verwenden, um die Ereignisweiterleitung zu verbessern. Dies ermöglicht es Organisationen, automatische Abhilfemaßnahmen einzurichten und zu verbessern. Das bedeutet, dass kein Mensch in einen Vorfall eingreifen muss, um ihn zu lösen. Dies reduziert auch den Explosionsradius eines Vorfalls durch intelligenteres Routing.

Verbesserte Verwaltung von Integrationsschlüsseln reduziert den Arbeitsaufwand bei der Verwaltung von Integrationsschlüsseln für verschiedene Überwachungstools. Dadurch können Benutzer Integrationsschlüssel in einer Ereignisorchestrierung kombinieren. Noch besser: Für alle PagerDuty -Pläne ist jetzt eine verbesserte Integrationsschlüsselverwaltung verfügbar.

Zusätzliche APIs ermöglichen eine Verwaltung im großen Maßstab. Teams können REST-APIs für die Verwaltung von Ereignisquellen und globalen Orchestrierungsregeln verwenden. Beide APIs bieten Terraform-Unterstützung. Diese APIs ergänzen die REST-APIs für die Verwaltung von Ereignisorchestrierung/Dienstorchestrierung.

„Die Nutzung von Global Event Orchestration von PagerDuty war entscheidend, um sicherzustellen, dass unsere Event-Routing-Prozesse effizient und skalierbar sind, um IT-Abläufe und -Ausgaben zu optimieren“, sagte Brian Long, Cloud Infrastructure Engineer bei Hyland. „Mit Global Event Orchestration kann unser Unternehmen den Zustand „gelöst“ aus unseren Benachrichtigungen erkennen, um ihn als Lösung auszuführen und die Anzahl der Stellen, an denen diese Bedingungen konfiguriert werden müssen, um mindestens den Faktor drei zu reduzieren. Dadurch haben wir mehr Zeit, uns auf Innovationen zu konzentrieren, nicht auf Konfiguration.“

Wie kann Global Event Orchestration meinem Team helfen?

Mit Global Event Orchestration sehen Teams:

  • Kodifizierte Prozesse zur Reaktion auf Vorfälle: Demokratisierung und Verteilung gut verständlicher Reaktionen auf Vorfälle an verteilte Teams
  • Weniger Vorfälle: Verwenden Sie kontextbezogene Ereignisdaten aus allen Diensten in Ihrem Ökosystem, um die Unterdrückungsgenauigkeit zu verbessern
  • Schnellere Auflösung: Automatisierung teamübergreifend anwenden und automatisierte Diagnosen im großen Maßstab mit standardisierter Anreicherung und Datennormalisierung ermöglichen

Wie Teams Global Event Orchestration nutzen, kann je nach Organisationsstruktur unterschiedlich sein. Die Funktionen sind auf zwei verschiedene Teams abgestimmt: ITOps-, SRE- und NOC-Teams sowie Entwicklerteams.

ITOps-Teams kann die Funktionen zur Ereignisnormalisierung nutzen und so sicherstellen, dass alle Ereignisse beim Eintreffen gleich aussehen.

SRE-Teams kann Automatisierung für einzelne oder alle Dienste innerhalb eines technischen Ökosystems erstellen und erweitern. Dies macht die Skalierung und Standardisierung der Automatisierung in einer Organisation einfacher als je zuvor.

Für L1-Reaktionsteams wie NOCs Global Event Orchestration hilft ihnen, die massive eingehende Ereigniswelle zu bewältigen. Ereignisse können an das NOC weitergeleitet werden, wenn sie bestimmte Kriterien erfüllen. Und während das Ereignis Regelebenen und verschachtelte Regeln durchläuft, kann die Automatisierung dem L1-Responder Diagnosen liefern. Wenn die Lösung für einen Vorfall bekannt ist, können Organisationen eine automatische Behebung erstellen.

Entwicklerteams wird weniger Vorfälle und eine schnellere Lösung erleben. Mit der automatischen Behebung können Vorfälle gelöst werden, bevor sie überhaupt die Dienste erreichen, für die die Entwicklerteams auf Abruf bereitstehen. Und dank detaillierter Routing-Kriterien werden Vorfälle nicht von Team zu Team weitergeleitet. Wenn die Automatisierung oder die NOC- oder L1-Responder den Vorfall nicht lösen können, wird er an den Fachexperten (SME) weitergeleitet. Und bis der SME mit der Bearbeitung des Vorfalls beginnt, stehen bereits Diagnoseinformationen zur Verfügung, was die Lösungszeit verkürzt.

Wie kann ich heute anfangen?

Global Event Orchestration ist grundsätzlich für alle PagerDuty AIOps-Kunden verfügbar. Um es in Aktion zu sehen, besuch uns auf Twitch Freitag, 14. April.

PagerDuty AIOps hilft Teams, weniger Vorfälle zu erleben, Probleme schneller zu lösen und die Produktivität zu steigern, ohne lange Implementierungen oder aufwändige laufende Wartung. Um PagerDuty AIOps auszuprobieren, können Sie eine Testversion anfordern Hier oder nimm Unsere Produkttour Wenn Sie mit dem Vertrieb sprechen möchten, kontaktieren Sie uns über diese Form .

Um mehr über Global Event Orchestration zu erfahren, registrieren Sie sich für diese Webinare . Wenn Sie ein PagerDuty AIOps-Kunde sind und Ihre erste Global Event Orchestration erstellen möchten, Knowledge Base-Artikel kann Ihnen zeigen, wie Sie anfangen.