- PagerDuty /
- Der Blog /
- Innovation /
- Unsere Dokumentation zur Reaktion auf Vorfälle als Open Source bereitstellen
Der Blog
Unsere Dokumentation zur Reaktion auf Vorfälle als Open Source bereitstellen
Zuverlässigkeit war schon immer eine der wichtigsten Designüberlegungen bei PagerDuty. (Wir haben sogar Verwenden Sie PagerDuty unter PagerDuty !) Aber was tun wir, wenn das Unerwartete passiert und tatsächlich etwas schief geht? Es ist von größter Wichtigkeit, dass wir vorbereitet sind und unsere Systeme so schnell wie möglich wieder voll funktionsfähig machen können. Wir sind stolz darauf, auftretende Probleme schnell lösen und dafür sorgen zu können, dass unsere Systeme innerhalb ihrer SLA funktionieren. Wir haben sehr hart daran gearbeitet, dies zu erreichen, und unser Vorfallreaktionsprozess ist der Anfang von allem.
Unsere interne Dokumentation zur Reaktion auf Vorfälle haben wir in den letzten Jahren aufgebaut, indem wir aus unseren Fehlern gelernt haben. Sie beschreibt detailliert die Best Practices unseres Prozesses, von der Vorbereitung neuer Mitarbeiter auf Bereitschaftsaufgaben bis hin zum Umgang mit größeren Vorfällen, sowohl während der Vorbereitung als auch nach der Arbeit. Nur wenige Unternehmen scheinen über ihre internen Prozesse zur Bewältigung größerer Vorfälle zu sprechen. Manchmal gilt es als tabu, das Wort „Vorfall“ in irgendeiner Art von Kommunikation überhaupt zu erwähnen. Das möchten wir ändern.
Aus diesem Grund freuen wir uns, Ihnen mitteilen zu können, dass wir nun Open Source sind. Dokumentation der Reaktion auf Vorfälle zur Verwendung durch die Community! Lernen Sie, wie wir uns auf Vorfälle vorbereiten, größere Vorfälle bewältigen und unsere Techniker für den Bereitschaftsdienst schulen. Wir hoffen, dass andere die Dokumentation als Ausgangspunkt verwenden, um ihre eigenen Prozesse zu formalisieren.
Was ist es?
Der PagerDuty Dokumentation zur Reaktion auf Vorfälle ist eine Sammlung bewährter Vorgehensweisen, die detailliert beschreiben, wie Sie mit eventuell auftretenden größeren Zwischenfällen effizient umgehen können. Außerdem erhalten Sie Informationen dazu, wie Sie effektiv Bereitschaftsdienste leisten. Sie enthält Lektionen, die Sie auf die harte Tour gelernt haben, sowie Schulungsmaterial, mit dem Sie schnell auf den neuesten Stand kommen.
Für wen ist das?
Es richtet sich an Bereitschaftspersonal und Personen, die an einem operativen Vorfallreaktionsprozess beteiligt sind oder einen formellen Vorfallreaktionsprozess einführen möchten.
Warum brauche ich es?
Die Reaktion auf Vorfälle ist etwas, das jede Organisation berücksichtigen muss, um ihren eigenen Kunden den bestmöglichen Service zu bieten. Normalerweise wird das Wissen über den Umgang mit Vorfällen in Ihrem Unternehmen im Laufe der Zeit aufgebaut und mit jedem Vorfall besser. Während Tools wie PagerDutys Anwendung „Große Zwischenfälle“ kann Ihnen helfen, sich schnell zu erholen, aber der Prozess, den Sie befolgen, ist genauso wichtig. Diese Dokumentation wird Ihnen helfen, Ihre Reaktionszeit bei größeren Vorfällen zu verkürzen, indem sie auf dem Wissen aufbaut, das wir im Laufe der Jahre intern entwickelt haben.
Was ist abgedeckt?
Es deckt alles ab, von der Vorbereitung bis auf Abruf gehen , Definitionen von Schweregrade , Vorfall Anrufetikette bis hin zur Ausführung eines Obduktion (wir bieten sogar unsere Post-Mortem-Vorlage ). Wir schließen sogar unsere Reaktionsprozess bei Sicherheitsvorfällen .
Was fehlt?
Es ist erwähnenswert, dass dies kein exakter Klon unserer internen Dokumentation; einige Informationen wurden entfernt oder geändert. Dinge wie unsere Telefonbrückennummern, Namen interner Tools und Systeme, die (noch) nicht Open Source sind, Bilder unserer Dashboards usw. Wir haben im Grunde alles weggelassen, was spezifisch für PagerDuty ist oder was wir für zu proprietär halten, um es weiterzugeben. Der Großteil der nützlichen Informationen liegt in den Grundsätzen und Prozessen und nicht in den Einzelheiten der von uns verwendeten Tools.
Lizenz
Die Dokumentation wird unter der Apache-Lizenz 2.0 bereitgestellt. Im Klartext bedeutet das, dass Sie die Dokumentation verwenden und ändern und sie sowohl kommerziell als auch privat nutzen können. Sie müssen jedoch alle ursprünglichen Copyright-Hinweise und die ursprüngliche LICENSE-Datei beifügen.
Unabhängig davon, ob Sie PagerDuty Kunde sind oder nicht, möchten wir, dass Sie die Möglichkeit haben, diese Dokumentation intern in Ihrem eigenen Unternehmen zu verwenden. Sie können Quellcode anzeigen für die gesamte Dokumentation auf unserem GitHub-Konto. Sie können das Repository gerne forken und als Grundlage für Ihre eigene interne Dokumentation verwenden.
Wir ermutigen Sie auch, Pull Requests zu stellen, wenn Sie Verbesserungsvorschläge haben.