Der Blog

So optimieren Sie Ihre Dienste mit PagerDuty

von Débora Cambé 6. September 2023 | 8 min Lesezeit

Es ist die Finalwoche der US Open, eines der meistgefeierten Sportereignisse der Welt. Tennis ist mein Lieblingssport, da ich fasziniert bin von der Kraft, Gelassenheit und Ausdauer, die jeder Spieler zeigt, wenn er allein auf dem Platz steht, manchmal bei unglaublich langen Matches – der aktuelle Rekord liegt bei 11:05 Uhr.

Tennisspieler sind in jeder Phase voll verantwortlich für den Ausgang ihrer Spiele. Ihre Leistung hat direkten Einfluss darauf, ob sie gewinnen oder verlieren. Wenn Ihnen das bekannt vorkommt, dann deshalb, weil es so ist. Service Ownership folgt demselben Ansatz: „Sie bauen es, Sie besitzen es.“ Im Kontext von DevOps arbeiten Sie nicht allein. Aber es gibt definitiv Lektionen, die man vom Tennis lernen kann, wenn es darum geht, gesunde, belastbare Dienste aufzubauen.

Die Parallele zeichnete sich ab, als wir Leeor Engel, Director of Engineering für die Produktlinie Incident Response, interviewten. Lesen Sie weiter und erfahren Sie, wie er seine Dienste optimiert und wie das PagerDuty Team die eigene Servicestandard-Funktionalität von PagerDuty nutzte, um die allgemeine Reife seiner Dienste zu verbessern.

Was sind Servicestandards?

Beim Schwenken zu einem Service-Eigentümerschaft Modell haben Organisationen Schwierigkeiten, einen klaren Überblick über ihre verschiedenen Dienste zu haben und ihre Konfigurationen zu vereinheitlichen. Vor einem Jahr für alle PagerDuty Pläne eingeführt, Servicestandards kann Teams dabei unterstützen, ihre Dienste besser zu konfigurieren, und gleichzeitig Managern und Administratoren dabei helfen, diese Standards im gesamten Unternehmen zu skalieren.

Mit den Servicestandards bietet PagerDuty neun Standards, die jeder Dienst erfüllen sollte, um die erforderliche Tiefe und den erforderlichen Kontext aufzuweisen, damit der Dienst als gut konfiguriert gilt. Alle Standards können ein- und ausgeschaltet werden.

PagerDutys Kunde Null: PagerDuty

Nach der Einführung von Service Standards war PagerDuty sein eigener Kunde Null. Leeor erläutert uns die Motivation hinter diesem Vorhaben: „ Sie wollen Akzeptanz erreichen und herausfinden, wo die Lücken sind, Feedback erhalten und Wege finden, [das Produkt] zu verbessern. Dann gab es ein organisatorisches Ziel. Wir sprechen viel darüber, was einen gut konfigurierten Dienst ausmacht und wie gut aussieht. Also haben wir uns sehr dafür eingesetzt, dass PagerDuty für diese Funktion zum Kunden Null wird. Im Grunde haben wir jedes Team dazu gebracht, alle seine Dienste zu überprüfen. Und wir haben tatsächlich festgestellt, dass viele Dienste die Standards nicht erfüllten. .”

Die Dienste unterschieden sich erheblich in ihrer Standardkonformität, aber „unter 50 %“ waren vollständig konform. Ungefähr vier Monate später wurde das Ziel einer 100-prozentigen Konformität erreicht. Aber es ist eine ständige Arbeit, dies so zu halten: „ Je nach Art des Dienstes kann es sehr schwierig sein, 10 von 10 [Standards] zu erreichen. Unser Ziel war es also, 100 % der Dienste zu mindestens 80 % konform zu machen. Das haben wir geschafft. Aber dann muss man sich ständig darum bemühen, das beizubehalten, weil ständig neue Dienste erstellt werden und man das leicht vergisst. Und so ist es unser kontinuierlicher Prozess, der diese Nachzügler auffängt und sie konform macht.

Wenn auch Sie Ihre Aufschläge verbessern möchten, können Sie aus der Dynamik des Tennis folgende vier Lehren ziehen, um dieses Ziel zu erreichen:

Sich warm laufen

Möglicherweise haben Sie erkannt, dass Sie Ihre Dienste standardisieren müssen, um im Bereich der Best Practices mitzuspielen. Aber vielleicht verfügt Ihr Unternehmen über Dutzende oder sogar Hunderte von Diensten und das ist überwältigend. Wo und wie sollten Sie anfangen, um sich nicht überfordert zu fühlen?

Lektion Nr. 1: Beginnen Sie mit der Grundlinie

Beim Tennis beginnt jedes Spiel an der Grundlinie. Hier schlagen die Spieler auf und sie bildet die Grundlage für ihre Positionierung und Strategie. Ohne ein gut entwickeltes Grundlinienspiel gibt es keine Chance zu gewinnen. Aber es muss schrittweise aufgebaut werden.

In ähnlicher Weise dienen Standards als Grundlage für die Qualität, Konsistenz und Funktionalität eines Dienstes. Es geht nicht darum, von Anfang an Perfektion zu erreichen, sondern vielmehr darum, eine strukturierte Grundlage zu haben, auf der man aufbauen kann. Nehmen Sie es mit Leeor: „ Sie sollten sich auf systemische Dinge konzentrieren und einen beliebigen Standard als Ausgangspunkt definieren. Machen Sie sich keine Sorgen, ob er perfekt ist. Setzen Sie ihn einfach um und führen Sie ein kontinuierliches Überwachungssystem ein. Und das wird am meisten bewirken, denn dadurch werden all die anderen Probleme aufgedeckt, die Sie möglicherweise in Ihren Prozessen haben und die Sie verbessern müssen, was auch immer es sein mag. Es wird sozusagen das Tor sein, um diese Dinge aufzudecken und sie dann anzugehen und kontinuierlich zu verbessern. .

Lektion Nr. 2: Passen Sie sich der Oberfläche an

Jeder Tennisspieler hat seinen eigenen Spielstil, muss sich aber an den Belag anpassen, auf dem er spielt, da jeder Belag eine andere Dynamik ermöglicht. Auf Rasen beispielsweise sind die Ballwechsel meist kürzer, da der Ball niedrig abprallt und die Spieler schneller an ihn herankommen müssen – das erfolgreiche Spielen am Netz und die Beherrschung des Volleys sind der Schlüssel zum Erfolg.

Im Zusammenhang mit Dienstleistungen ist das Erkennen der individuellen Umstände jedes Teams ein entscheidender erster Schritt bei der Bestimmung, welchen Standards der Service dieses Teams folgen soll. Wie Leeor erklärt: „ Teams können hinsichtlich ihrer Dienste ganz unterschiedliche Anforderungen haben. Manchmal ist ihre Integrationskonfiguration ein wenig anders. Manchmal überwachen sie keine Dinge, die direkt auf Codebereitstellungen basieren. Einer unserer Servicestandards sieht beispielsweise mindestens eine Änderungsintegration vor – wir haben möglicherweise Dienste, die dies nicht tun. Es kann sich dabei um Triage-Dienste handeln, die E-Mail-Integrationen oder ähnliches haben. Diese Dienste bieten immer noch einen Mehrwert und benötigen einen Standard, aber einen etwas anderen. . Es gibt keine Einheitslösung, die für alle funktioniert.

Das Spiel gewinnen

Die Grundlagen sind gelegt: Sie haben die Grenzen und Standards Ihres Dienstes entsprechend den Anforderungen des Teams definiert, dem er gehört. Jetzt müssen Sie sicherstellen, dass diese Standards eingehalten werden. Wie?

Lektion Nr. 3: Vermeiden Sie unnötige Fehler

Ein unerzwungener Fehler liegt vor, wenn ein Spieler einen Punkt verliert, obwohl er die Ausführung völlig unter seiner Kontrolle hatte, also nicht vom Gegner erzwungen wurde.

Teams sind dafür verantwortlich, ihre Servicestandards unter Kontrolle zu halten, aber in der schnelllebigen DevOps-Welt kann das schwierig sein; je nach Geschäftsanforderungen können sich Services ändern oder neue Services erstellt werden. Leeor hebt drei wesentliche Schritte hervor, um das Gleichgewicht Ihrer Servicestandards erfolgreich aufrechtzuerhalten und die Falle unnötiger Fehler zu vermeiden:

  • Monitor : Mit der neuen PagerDuty Service Standards API können Sie Ihre Servicestandards regelmäßig abrufen. So können Sie überprüfen, ob die Standards den Serviceanforderungen entsprechen, ob sie möglicherweise geändert werden müssen oder ob es sinnvoll ist, Ausnahmen zu schaffen.
  • Bericht : Erstellen Sie ein Berichtssystem, in dem Sie einen regelmäßigen Rhythmus definieren, um den Status aller Dienste zu bewerten. Mit den PagerDuty Service Standards ist dies ganz einfach, da die Serviceleistungsdaten von den Administratoren aus PagerDuty exportiert und nach Bedarf freigegeben werden können, um die Verantwortlichkeit zu fördern und den Fortschritt aufzuzeigen. Administratoren haben auch die Möglichkeit, Standards öffentlich zugänglich zu machen, damit der Rest der Organisation sie einsehen kann.
  • Bilden und gebildet werden : Leeor erklärt, wie das direkte und häufige Gespräch mit Teambesitzern das Bewusstsein schärfen und auf die Wichtigkeit der Einhaltung von Servicestandards aufmerksam machen kann: „ Beispielsweise wurden Business Services nicht von allen Teams einheitlich genutzt, obwohl es eigentlich ziemlich nützlich ist. Schon allein, um einen übergeordneten Business Service für Ihren Bereich zu haben. Dann können Sie Funktionen wie den Service Graph oder die Business Impact-Funktionen nutzen. Ein System, in dem Sie alle Ihre Services aus der Vogelperspektive sehen können. .“ Es kann auch helfen, verschiedene Anwendungsfälle aufzuzeigen: „ Im Laufe der Zeit haben wir diesen Prozess entwickelt, bei dem wir einige Ausnahmen machen konnten. Ein Beispiel wäre das Testen eines Dienstes, der noch nicht in Produktion ist und für den es noch keine Eskalationsrichtlinie gibt. Also haben wir einen Ausnahmeprozess eingerichtet – der im Idealfall vorübergehend war – und einige Ausnahmen für bestimmte Standards festgelegt. .”

Gewinne das Spiel

Lektion Nr. 4: Kontinuierliche Verbesserung

Das Schöne am Tennis ist, dass sich der Verlauf eines Spiels schlagartig ändern kann. Es gibt kein Zeitlimit für ein Spiel oder gar einen Satz und die Spieler sind nicht nur von Variablen abhängig, die sie kontrollieren können: Da sind die Konzentration und körperliche Verfassung des Gegners, das Wetter und sogar das Publikum. Feuern sie Sie an?

Beim Tennis geht es um kontinuierliche Verbesserung, und das gilt auch für Services. Gut konfigurierte Services helfen dabei, Best Practices für Service Ownership zu skalieren, was wiederum den operativen Reifegrad des Unternehmens steigert.

Hier ist Leeors wichtigster Ratschlag, um dorthin zu gelangen: „ Der Schlüssel ist die Berichterstattung. Natürlich müssen Sie Ihren Standard festlegen, und dieser kann je nach Unternehmen etwas anders aussehen. Aber wirklich entscheidend ist die kontinuierliche Überwachung und Berichterstattung. Fehler passieren, Dinge werden übersehen, Menschen sind Menschen, richtig? Sie brauchen also einen Prozess, der die Dinge auffängt, die durchs Raster fallen. Definieren Sie einen Standard und überwachen Sie ihn kontinuierlich, wie Sie es mit jedem anderen Prozess tun würden. Sie versuchen, sich kontinuierlich zu verbessern. Sie müssen ihn überwachen.

Verbessern Sie Ihre Dienstleistungen

Setzen Sie all diese Lektionen mit der PagerDuty Operations Cloud in die Praxis um, der unverzichtbaren Plattform, um Ihre Dienste in Form zu bringen und alle ungeplanten, zeitkritischen und kritischen Arbeiten im gesamten Unternehmen zu verwalten. Mehr erfahren Hier und probieren Sie unsere 14 Tage kostenlos testen .