Der Blog

Overrides, die menschlichste Funktion in PagerDuty

von Lisa Yang 9. Oktober 2018 | 5 Minuten Lesezeit

Über was?

Wenn Sie schon einmal Bereitschaftsdienst hatten, wissen Sie, dass die Vorfälle nicht aufhören, nur weil Sie die Grippe haben. Oder wenn Sie an der Highschool-Abschlussfeier Ihres Kindes teilnehmen. Oder, wie ich selbst erfahren habe, sogar, wenn Sie auf Ihrer eigenen Hochzeit sind. Konfuzius sagte einmal: „Wenn während Ihres Bereitschaftsdienstes noch nie ein großes Ereignis stattgefunden hat, dann haben Sie vielleicht nie gelebt.“ (Okay, das habe ich mir komplett ausgedacht.)

Spaß beiseite, das Leben geht weiter. Zeitplanüberschreibung , oder wie wir es liebevoll nennen, „Overrides“, ist eine Einstellung in PagerDuty -Zeitplänen, mit der Sie jemand anderen bitten können, entweder einen Teil oder die gesamte Bereitschaftsschicht zu übernehmen. Dies ist nützlich für Personen mit geplanten Urlauben, ungeplanten Krankheiten oder anderen Lebensereignissen, die während ihrer Bereitschaftsschichten eintreten, da Sie den Bereitschaftshelfer ändern können, ohne den gesamten Bereitschaftsdienst oder -plan zu ändern.

Warum das sonst noch so toll ist? Weil Sie, wie ich ebenfalls aus erster Hand erfahren habe, statt Ihren Laptop zur ersten Geburtstagsparty Ihres Hundes mitzuschleppen, Ihren Lieblingskollegen fragen können, ob er oder sie bereit wäre, für ein paar Stunden die Rufbereitschaft zu übernehmen, während Sie das Ende der zweimonatlichen Tierarztbesuche feiern.

DevOps-Wer?

Viele unserer Kunden haben eine DevOps-Kultur oder wechseln gerade zu einer DevOps-Struktur. DevOps-Kultur , werden Ingenieure ermutigt, es zu programmieren, auszuliefern und zu besitzen – was bedeutet, dass, wenn der Code seines/ihres Teams kaputt geht, er/sie derjenige ist, der für die Behebung verantwortlich ist. Diese Kultur ermutigt das Team, eine Reihe von Dingen zu tun: besseren Code zu schreiben, bessere Tests zu schreiben, stabilere Bereitstellungen zu haben und präventiv einen Rollback-Plan zu haben. Wenn das Team mitten in der Nacht wegen eines Vorfalls aufwachen muss, ist es weniger wahrscheinlich, dass es mit dem Code zusammenhängt. Da die Ingenieure jetzt auch die Antwortenden sind, beseitigen wir das klassische „Über-die-Wand“-Dilemma.

Wir haben PagerDuty mit der Absicht entwickelt, jedem Techniker/Responder die Möglichkeit zu geben, neben seinem Code auch seinen eigenen Bereitschaftsdienst zu verwalten. In PagerDuty bestimmt jeder Benutzer, für welche Dienste er verantwortlich ist und welche Bereitschaftsrotation aussieht, einschließlich Angaben dazu, wann Überschreibungen geplant werden sollen.

HealthOps-Welche?

Die Override-Funktion ist die menschlichste Funktion in PagerDuty. Wie Sie vielleicht aus einem unserer vorherigen Blogbeiträge über Betriebszustand , Mitarbeiter, die den Großteil der Bereitschaftslast tragen, sind ausgebrannt. Diese ausgebrannten Mitarbeiter erbringen bei der Arbeit keine so gute Leistung, machen möglicherweise mehr Fehler und kosten das Unternehmen letztendlich Zeit und Ressourcen. Darüber hinaus könnten sie aus purer Erschöpfung oder einfach aus purer Frustration kündigen, weil ihr Leben ständig durch arbeitsbezogene Anrufe unterbrochen wird – was bedeutet, dass ihr Unternehmen einen qualifizierten Mitarbeiter verliert. Kosten von bis zu 300.000 US-Dollar pro Person .

Wir arbeiten in einer Branche, in der wir über unzählige Tools verfügen, um den Zustand von Servern, die Stabilität von Anwendungen und die Reaktionsfähigkeit von Webseiten zu messen. Darüber hinaus gibt es noch ein weiteres Tool, das Sie über fehlerhafte Server, instabile Anwendungen und nicht reagierende Webseiten informiert! Wir sorgen dafür, dass unsere Kunden zufrieden und unser Unternehmen produktiv bleibt, und zwar auf Kosten der Gesundheit unserer Helfer, die Tag und Nacht daran arbeiten, einen Fehler zu beheben, oder den ersten Kinoauftritt ihres Drittklässlers verpassen, um ein Bereitstellungsproblem zu beheben. Wir vernachlässigen oft die Gesundheit dieser echten Menschen, die ihre Wochenenden, Abende und manchmal sogar ihre Schlafenszeit damit verbringen, sicherzustellen, dass unsere digitalen Systeme betriebsbereit sind.

Hier können Overrides helfen. Dieses Jahr während der PagerDuty University-Veranstaltung bei Gipfel , sprach ich mit einem Herrn, der seine eigenen Ideen für die Planung von Überschreibungen hatte. Dan Wade von Vacasa teilte mit, dass sein Team auf einen wöchentlichen 24/7-Rhythmus eingestellt ist, bei dem jeder Helfer jeweils 7 Tage lang Bereitschaftsdienst hat. Er bemerkte, dass eine seiner Teamkolleginnen einen besonders schwierigen Bereitschaftsdienst hatte – während ihrer Bereitschaftsdienstzeit ereigneten sich einige Vorfälle der Schwere 1. Jeder Vorfall der Schwere 1 dauerte Tage, bis er behoben war. Da er wusste, dass sie einige Tage lang nicht geschlafen hatte, übernahm er den Rest ihrer Bereitschaftsschicht, damit sie sich die dringend benötigte Ruhe gönnen konnte. In dieser Situation war Dans Teamkollegin letztendlich eine glücklichere und produktivere Mitarbeiterin, weil er Mitgefühl für ihre Situation zeigte.

Dan war nicht nur ein Held für sein Team, sondern auch ein Vorbild, von dem wir alle lernen sollten. Als moderner Techniker ist Bereitschaftsdienst nicht mehr nur den Ops-Leuten/-Mädels vorbehalten, sondern für jeden, der mit einem Digitalsignal . Digitale Signale machen keine Unterschiede zwischen Tageszeit, besonderen Anlässen, Lebensereignissen oder Müdigkeit. Als Kollege liegt es in Ihren Händen, sich zu engagieren und einige Ihrer verfügbaren Ressourcen zu teilen, sei es Zeit, Energie oder Liebe.

Denken Sie daran: Das nächste Mal du bist auf Abruf, soll es der „Boulevard der zerbrochenen Träume“ oder „Wake Me Up When September Ends“ sein?