Der Blog

Bessere Postmortem-Analysen von Vorfällen

von Paul Rechsteiner 9. Mai 2017 | 4 Minuten Lesezeit

Während eines größeren Vorfalls liegt Ihr Fokus ganz auf der Wiederherstellung des Dienstes: Beobachten Sie den Rauch, finden Sie heraus, wo das Feuer ist, und löschen Sie es. Aber nachdem der Dienst wiederhergestellt wurde – der Vorfall ist gelöst, das Adrenalin ist abgeflossen und es ist Ruhezeit – ist es an der Zeit, aus dem Geschehenen zu lernen und diese Erkenntnisse dann zu nutzen, um zukünftige Vorfälle besser zu lösen, darauf zu reagieren und ihnen vorzubeugen. Die wichtigste bewährte Methode, die diesen Verbesserungszyklus ermöglicht, ist die Postmortem-Prozess und PagerDuty freut sich, Ihnen vorstellen zu dürfen Integrierte Unterstützung für Postmortems in unserem vollen Plattform für das Lebenszyklus-Vorfallmanagement ! Gekoppelt mit mehreren anderen PagerDuty Funktionen, wie System- und Betriebseffizienzanalyse und der Operations Command Console bieten wir Ihnen jetzt alles, was Sie brauchen, um sowohl die Ausfallsicherheit Ihrer Infrastruktur als auch Ihren Lösungsprozess zu erlernen und proaktiv zu verbessern.

PagerDuty verbessert alle Teile des Postmortem-Prozesses, vom Erstellen der Zeitleiste bis hin zur Nachverfolgung des Status von Postmortems. Erstellen Sie eine Zeitleiste mit relevanten PagerDuty und Chat-Aktivitäten in Minuten statt in Stunden und verwenden Sie diese detaillierte Aufschlüsselung dann, um die Grundursache effizient zu untersuchen, die Wirksamkeit der Reaktion zu bewerten und die wichtigsten Folgemaßnahmen festzulegen. Wir haben die Reibungspunkte bei der Durchführung effektiver Postmortems beseitigt, sodass Sie mehr Ihrer Postmortem-Zeit auf das Lernen und weniger auf manuelle Arbeit verwenden können. Wie einfach können Ihre Postmortems sein? Werfen wir einen Blick darauf!

Jetzt können Sie den Postmortem-Prozess für einen Vorfall mit nur einem Klick starten:

Untersuchen

Nachdem der Postmortem-Bericht erstellt wurde, ist es an der Zeit, die Ärmel hochzukrempeln und zu untersuchen, was tatsächlich passiert ist. Wir möchten die Aktivitäten aus unseren bereits bestehende Kommunikationsquellen und Reaktion auf Vorfälle: Chat und PagerDuty. Unsere PagerDuty Vorfallinformationen wurden automatisch mit unserer neuen Postmortem-Analyse verknüpft, also fügen wir die relevanten Chat-Kanäle hinzu:

Jetzt können wir die kombinierte Aktivität des Vorfalls und dieser Chatrooms überprüfen und in die Postmortem-Zeitleiste genau die Teile aufnehmen, die für das Verständnis des Vorfalls am relevantesten sind. Wir möchten mehrere Aspekte des Vorfalls abdecken: die beteiligten Technologiesysteme, die Wirksamkeit unserer Reaktion und die Lösungsschritte.

Postmortem-Zeitleiste

Auch das Einfügen eines Elements in die Postmortem-Zeitleiste ist mit nur einem Klick erledigt – kein Ausschneiden und Einfügen, kein Wechseln zwischen Anwendungen, keine fehleranfällige und manuelle Zeitzonenberechnung. Die gesamte Bandbreite der PagerDuty Aktivitäten kann einbezogen werden: Zustandsänderungen von Vorfällen, Notizen, Eskalationen, Benachrichtigungen, wann zusätzliche Helfer angefordert wurden, wann Statusaktualisierungen an die Beteiligten versandt wurden und mehr. Sobald sich die Aktivität in der Zeitleiste befindet, können Sie auch Anmerkungen hinzufügen, um ihre Relevanz für den Vorfall zu beschreiben, wie hier zu sehen:

Analysieren

Nachdem wir die Zeitleiste erstellt haben, können wir mit der Analysephase fortfahren. Dabei geht es darum, zusammenzufassen, was passiert ist, die zugrunde liegende Ursache zu identifizieren, den Lösungsweg aufzuzeigen und so weiter. Dieser Schritt ist entscheidend, da er es dem Team ermöglicht, zu reflektieren, was gut funktioniert hat und wo wir es besser hätten machen können, und dann die wichtigsten Verbesserungen zu identifizieren, die als Aktionspunkte verfolgt werden müssen. All dies lässt sich leicht im Postmortem-Editor erfassen, der auch Anweisungen für die Vorgehensweise in jedem dieser Abschnitte bietet:

Und so einfach ist es!

Optimieren Sie das Post-Mortem-Management

Nicht nur ist die Erstellung einzelner Postmortems einfacher und effektiver, auch der Gesamtprozess wird deutlich rationalisiert. Alle Postmortems sind im Katalog verfügbar.

Dies erleichtert das Auffinden von Postmortems, das Identifizieren von schwerwiegenden, lang andauernden Vorfällen und das Erkennen, welche Postmortems noch in Bearbeitung oder bereits abgeschlossen sind. Postmortems können auch als PDFs zur Verteilung oder Archivierung exportiert werden, und sowohl die Berichtsvorlage als auch die Anweisungen für die einzelnen Abschnitte für Autoren können an die Anforderungen Ihrer Organisation angepasst werden. Zusammen bieten all diese Tools einen vollständigen End-to-End-Postmortem-Prozess, der sowohl einfach zu verwenden ist Und einfach zu handhaben.

Mit dieser Funktionssuite können Sie das Beste aus Postmortem-Analysen herausholen:

  • Das Erstellen einer Zeitleiste ist schneller, weniger mühsam und ermöglicht umfassendere Erkenntnisse.
  • Mit einer vereinfachten Toolchain ist es viel einfacher, den Postmortem-Prozess zu verwalten.
  • Ihr Team kann die kontinuierliche Verbesserung beschleunigen, indem es mehr und bessere Erkenntnisse gewinnt und gleichzeitig weniger Zeit für den Prozess aufwendet.

Wir hoffen, dass diese Funktion es Ihrem Team so einfach wie möglich macht, eine Kultur des gemeinsamen Lernens zu fördern. Und wenn Sie mehr erfahren möchten, laden Sie unsere kostenlose Obduktionshandbuch für Best Practices zur Durchführung effektiver Post-Mortem-Analysen.

PagerDuty Postmortems ist für alle Kunden in unseren Standard- und Enterprise-Paketen enthalten. Um loszulegen, schauen Sie sich die Support-Artikel hier !