Der Blog

Einrichten Ihres PagerDuty für den süßen Sieg

von Lisa Yang 19. März 2019 | 10 Minuten Lesezeit

Herzlichen Glückwunsch! Sie haben gerade PagerDuty gekauft, was bedeutet, dass Sie sich entschieden haben, in Ihr Vorfallmanagementprozess . Um Ihre Investition jedoch zu maximieren, müssen Sie alle beweglichen Teile von PagerDuty verstehen.

Heute richten wir PagerDuty für ein Team ein: das Bikini Bottom Team. Ich zeige Ihnen, wie Sie Benutzer, Teams, Zeitpläne, Eskalationsrichtlinien und Dienste einrichten und erkläre Ihnen, warum diese für den Vorfallreaktionsprozess wichtig sind.

Dieses Bikini Bottom-Team nach Goldstandard kann als Vorlage verwendet werden, um PagerDuty im Rest Ihrer Organisation einzuführen. (Lesen Sie unbedingt den gesamten Artikel, bevor Sie Assets in Ihrem PagerDuty Konto konfigurieren – glauben Sie mir, das wird Ihnen viele haarsträubende Momente ersparen).

Wer sind die Benutzer?

„Um ein Sandwich zu fahren, braucht man keinen Führerschein.“
– Patrick Star, Bikini Bottom

Der erste Schritt beim Einrichten Ihrer PagerDuty Instanz besteht darin, zu entscheiden, welche Benutzer PagerDuty Zugriff benötigen. Es gibt zwei verschiedene Arten von Benutzerlizenzen: Benutzer Und Interessengruppen .

Benutzerlizenzen sind für die Leute gedacht, die auf Abruf bereitstehen, bei Vorfällen angepiept werden und von denen erwartet wird, dass sie Updates posten oder diese Vorfälle lösen. Ihre Manager benötigen außerdem eine Benutzerlizenz für PagerDuty. Für das Bikini Bottom-Team benötigen SpongeBob, Patrick Star und Thaddäus, die auf Vorfälle reagieren, also alle Benutzerlizenzen. Ihr Manager Mr. Krabs benötigt ebenfalls eine Benutzerlizenz, um die Anwendungen einzurichten, auf die sein Team reagieren soll.

Stakeholder-Lizenzen sind schreibgeschützte Lizenzen, mit denen die Person Updates zu Vorfällen erhalten kann, aber nicht am Behebungsprozess teilnehmen muss. Gary the Snail ist beispielsweise ein leitender Angestellter, dem das Bikini Bottom-Team unterstellt ist. Er benötigt also nur eine Stakeholder-Lizenz, da er nicht an der Vorfall-Triage teilnimmt. Gary the Snail benötigt lediglich Einblick in den Status des Vorfalls und die Aktionen des Bikini Bottom-Teams.

Großartig, wir haben ermittelt, wer in PagerDuty sein muss! Jetzt ist es an der Zeit zu überlegen, welche Basisrolle jeder Benutzer haben sollte.

Was sind Basisrollen?

Basisrollen bestimmen den Zugriff eines Benutzers auf die Einstellungen auf PagerDuty -Kontoebene.

A Bewährte Vorgehensweise bei PagerDuty besteht darin, die Basisrolle aller Benutzer auf „Beobachter“ festzulegen und dann entsprechend ihrer Teamrollen umfassenderen Zugriff zu gewähren (mehr dazu im nächsten Abschnitt). Diejenigen, die keinem Team hinzugefügt wurden oder nicht darum gebeten haben, einem Team hinzugefügt zu werden, benötigen möglicherweise keinen PagerDuty Zugriff.

Darüber hinaus sollte dem PagerDuty -Administratorteam der Zugriff „Globaler Administrator“ gewährt werden, damit es bei Rollenänderungen Änderungen am Konto vornehmen kann, z. B. Teammanager entfernen kann, die keinen PagerDuty Zugriff mehr benötigen.

Rolle Alle Teams Alle Termine Alle Eskalationsrichtlinien Alle Services Alle Vorfälle Alle Nutzer
Globaler Administrator Bearbeitungszugriff Bearbeitungszugriff Bearbeitungszugriff Bearbeitungszugriff Bearbeitungszugriff Bearbeitungszugriff
Manager Bearbeitungszugriff Bearbeitungszugriff Bearbeitungszugriff Bearbeitungszugriff Bearbeitungszugriff Nur anschauen
Antwortender* Nur anschauen Nur anschauen Nur anschauen Nur anschauen Bearbeitungszugriff Nur anschauen
Beobachter* Nur anschauen Nur anschauen Nur anschauen Nur anschauen Nur anschauen Nur anschauen
Eingeschränkter Zugang* Kein Zugang Kein Zugang Kein Zugang Kein Zugang Kein Zugang Kein Zugang

Beispielhafte Aufschlüsselung der Zugriffsrechte, die verschiedenen Rollen in einer Organisation zugewiesen werden.
*Rollen mit Sternchen können mit Teamrollen erweiterte Zugriffsrechte erhalten.

Was beinhaltet eine Teamrolle?

In meinem Blogbeitrag zur Asset-Taxonomie , habe ich die Bedeutung der Benennung von Teams innerhalb von PagerDuty erörtert, um reale Teams widerzuspiegeln. Wenn Ihre PagerDuty -Teams mit „realen“ Teams auf dem neuesten Stand sind, wird verhindert, dass die falsche Person angepiept wird. Für Bereitschaftshelfer gehört es zum Job, mitten in der Nacht aufzuwachen. Aber für einen Alarm aufzuwachen, den Sie nicht mehr verwalten, ist der Tod von Seelen. Stellen Sie es sich so vor: Jedes Mal, wenn ein Alarm an den falschen Helfer gesendet wird, steigt die Meerestemperatur um 1 Grad. (Zu früh?)

über GIPHY

Also, Teamrollen. Für jeden Benutzer stehen drei verschiedene Teamrollen zur Verfügung: Beobachter , Antwortender , Und Manager . Beobachter in privaten Teams haben Einblick in die Assets des Teams (aber keine Bearbeitungsrechte). Team Antwortende können nur die ihnen zugewiesenen Vorfälle bestätigen, lösen und Außerkraftsetzungen planen. Team Manager können Benutzer, Zeitpläne, Eskalationsrichtlinien und Dienste nur für die Assets in ihrem Team hinzufügen und entfernen.

Für das Bikini Bottom-Team wird Mr. Krabs die Rolle des Teammanagers und SpongeBob, Patrick und Thaddäus die Rolle des Team-Responders zugewiesen.

Zeitpläne
Mit der Zeitplanfunktion von PagerDuty können Sie Ihre Bereitschaftsrotation und Ihr Bereitschaftsmuster einmal einrichten; den Rest erledigen wir. In der Zeitplankonsole können Sie festlegen, welche Benutzer Bereitschaftsdienst haben, wann sie Bereitschaftsdienst haben, in welcher Reihenfolge sie Bereitschaftsdienst haben und zu welchen Tageszeiten jemand Bereitschaftsdienst hat, um nur einige Vorteile zu nennen. Sie sollten den Zeitplan mit so viel Kontext wie möglich benennen und dabei Folgendes berücksichtigen:

  • Die Teilmenge der Benutzer im Team, die auf Abruf bereitstehen
  • Ob dieser Zeitplan spezifisch für einen Dienst ist
  • Warum der Zeitplan dienstspezifisch ist

Patrick und Thaddäus sind beispielsweise auf die „Salatwartung“ spezialisiert, Spongebob muss also nicht Teil des „Salat“-Wartungsplans sein. Dieser Plan würde „Bikini Bottom Team|Krabbi Patty|Salatrotation“ heißen, eine Untergruppe des „Bikini Bottom Team-Plans“. Sie können den Plan zu Rate ziehen, um zu erfahren, dass er speziell für die „Salatwartung“ ist, und wenn Sie darauf klicken, erfahren Sie, wer die SMEs für „Salat“-bezogene Probleme sind.

Darüber hinaus besagen die Best Practices von DevOps, dass nur Mitarbeiter, die auf den Alarm reagieren können, für den jeweiligen Dienst im Bereitschaftsdienst sein sollten. In diesem Fall können Sie zwar jemanden wie Plankton (der nicht zum Krabbenburger-Team gehört) in den Dienstplan aufnehmen, aber Sie sollten das nicht tun, da er ohnehin nicht auf Alarme reagieren kann.

Hier ist ein Testszenario zu Zeitplänen – wählen Sie die beste Antwort!

Sandy Cheeks hat für den Krabbenburger-Service Bereitschaftsdienst. Ein Alarm kommt, der Server brennt, sie weiß nicht, was sie tun soll, also weckt sie Thaddäus, damit er das Problem behebt. Wie reagieren Sie?

A) Das ist völlig in Ordnung – je mehr, desto besser bei der Reaktion auf Vorfälle.
B) Sandy sollte für diesen Dienst nicht im Rotationsprinzip enthalten sein.
C) Sandy sollte in der Vorfalltriage für Dienst A geschult werden, bevor sie in den Dienstplan aufgenommen wird.
D) Sandy sollte nach jeder Benachrichtigung die Meerestemperatur testen.

Wenn Sie C gewählt haben, liegen Sie richtig!

Wenn Sandy Thaddäus aufrufen muss, um ein Problem in Ihrer Umgebung zu beheben, ist Thaddäus Ihr einziger Ausfallpunkt. Denken Sie daran: Ihr Anwendungsstapel ist nur so widerstandsfähig wie Ihre einzelnen Ausfallpunkte.

https://giphy.com/gifs/spongebob-spongebob-squarepants-season-6-26FmjKdhkXyfUPnj2

Eskalationsrichtlinien
Wenn Sie SLAs oder SLOs einhalten müssen, Eskalationsrichtlinie (EP) ist Ihr bester Freund. Ein EP bestimmt, wer benachrichtigt wird, wenn ein Alarm bei einem Dienst eingeht.

Nehmen wir an, Herr Krabs definiert das SLA für den Krabbenburger-Service, wonach ein Techniker 1) innerhalb von 30 Minuten auf einen Vorfall reagieren und 2) den besagten Vorfall innerhalb von zwei Stunden lösen muss.

Um die besten Chancen zur Einhaltung seiner SLAs zu haben, sollte Herr Krabs das EP wie folgt einrichten:

  1. Mr. Krabs setzt seinen Fachexperten SpongeBob als erste Verteidigungslinie ein. Wenn SpongeBob Quallen fängt und den Alarm verpasst, wird das Problem nach 15 Minuten, also innerhalb der SLA, automatisch an Thaddäus weitergeleitet.
  2. Wenn sich Thaddäus nun alle Knochen bricht und den Pager nicht bestätigen kann, wird Mr. Krabs nach 15 Minuten benachrichtigt – was immer noch innerhalb der SLA liegt.

 

 

So wird diese EP in PagerDuty aussehen:

 

 

Allerdings sind nicht alle Dienste gleich. Der Krabbenburger-Dienst hat eine SLA von zwei Stunden, aber andere, weniger dringende Dienste geben den Helfern mehr Zeit, bevor sie den Vorfall an den nächsten Helfer weiterleiten. Im folgenden Beispiel für den Muscle Beach-Dienst hat Patrick zwei Stunden Zeit, um zu reagieren, bevor der Vorfall an Mr. Krabs weitergeleitet wird.

 

 

Einrichten von Diensten in PagerDuty
Halten Sie sich gut fest, wir haben den Kreis fast geschlossen! Die erste Sache Nachdem Sie Zugriff auf Ihre PagerDuty Instanz erhalten haben, möchten Sie zunächst festlegen, worüber PagerDuty Ihnen Warnmeldungen senden soll. Anders ausgedrückt: Für welche Dienste möchten Sie Warnmeldungen erhalten?

Warum spreche ich also zuletzt über Dienstleistungen?

Gute Frage. Aber hinter meinem Wahnsinn steckt Methode: Um einen Dienst einrichten zu können, müssen Sie zuerst Ihre Benutzer, Teams, Zeitpläne und Eskalationsrichtlinien einrichten.

Kurz gesagt sendet das Bun Burner Monitoring Tool Ereignisse an einen Dienst in PagerDuty (Krabby Patty|Buns), der über eine Eskalationsrichtlinie verfügt. Der Zeitplan der Eskalationsrichtlinie bestimmt, wer benachrichtigt werden soll. In diesem Fall verbrennen Buns schnell, sodass die Eskalationsrichtlinie ein SLA von 5 Minuten hat und Benutzer von Team Bikini Bottom im Zeitplan stehen, wie unten dargestellt:

Was mich zur nächsten Frage bringt: Wie bestimmen Sie, welche Dienste in PagerDuty eingerichtet werden sollen?

Zunächst müssen Sie herausfinden, was Ihnen wichtig ist.

Hier sind einige Optionen, um das Wichtigste einzugrenzen:

  • Teilen Sie die Geschäftsdienste in ihre eigenen, separaten Komponenten auf.
  • Nehmen Sie jedes Team, das Sie zuvor definiert haben, und sehen Sie sich dessen Verantwortungsbereiche an.
  • Ziehen Sie einen Servicekatalog zu Rate (sofern Sie einen haben).
  • Sehen Sie sich Ihre Überwachungstools an und sehen Sie, was Sie überwachen.

Idealerweise sollten Sie jeden Dienst so detailliert wie möglich aufschlüsseln. Wenn Sie beispielsweise eine Krabbenburger-Anwendung haben, möchten Sie einen Dienst für Folgendes erstellen:

  • Krabbenburger|Brötchen
  • Krabbenburger|Patty
  • Krabbenburger|Salat
  • Krabbenburger|Tomate
  • Krabbenburger|Zwiebel
  • Krabbenburger|Geheimsauce

Wenn SpongeBob also um 2 Uhr morgens eine Warnmeldung vom Brötchendienst erhält, ist diese wesentlich informativer als eine Warnmeldung vom Krabbenburgerdienst und ermöglicht ihm, schneller zu reagieren und den Vorfall zu beheben, um die SLAs einzuhalten.

Nachdem Sie entschieden haben, welche Dienste Sie in PagerDuty erstellen müssen, können Sie rückwärts arbeiten und deren EPs festlegen und festlegen, wer für jeden Dienst in den Zeitplan aufgenommen werden soll. Dadurch wird dann bestimmt, wer eine Benutzerlizenz in PagerDuty benötigt.

https://giphy.com/gifs/reactionseditor-reaction-26u4lOMA8JKSnL9Uk

 

Vorfallmanagement – vereinfacht
Patricks Verstand mag ein Rätsel sein, Ihr Vorfallmanagementprozess muss es nicht sein. Indem Sie PagerDuty richtig einrichten, haben Sie Folgendes identifiziert:

  • Anwendungen/Dienste, die Ihnen (zumindest Ihrem Team) wichtig sind.
  • Das SLA für jeden Dienst.
  • Die Anlaufstelle, wenn eine Anwendung fehlschlägt (und auch die Wissenszentren im Team, an denen es mangelt!).
  • Wer ist in welchem Team?

Dies ist das absolute Minimum, um PagerDuty einzurichten. Wir haben eine Fülle von Funktionen, die Ihr digitales Betriebsmanagement weiter verbessern, wie zum Beispiel Moderne Reaktion auf Vorfälle , Ereignisintelligenz , Analyse , Und Sichtweite . Schauen Sie später noch einmal vorbei, um weitere Best Practices zu erfahren und zu lernen, wie Sie das Beste aus Ihrer PagerDuty Investition herausholen können!