Der Blog

Optimierte Reaktion des Unternehmens auf technische Störungen

von George Miranda 12. August 2019 | 5 Minuten Lesezeit

Die meisten technischen Notfallreaktionspläne berücksichtigen in der Regel die Kommunikation mit den Stakeholdern – sowohl mit internen Teams als auch mit externen Kunden. Aber bei PagerDuty haben wir von unseren Kunden gelernt, dass es immer noch eine schmerzhafte und kostspielige Lücke in der Abstimmung zwischen IT- und Geschäftsteams gibt. Um diese Lücke zu schließen, müssen wir uns darauf konzentrieren, was die Reaktion auf Vorfälle für Geschäftsteams .

Produktlösungen kann helfen, einige der Herausforderungen zu bewältigen, Stakeholder-Kommunikation . Um jedoch eine effektive Reaktion im gesamten Unternehmen weiter zu unterstützen, benötigen wir auch prozessorientierte Lösungen, die unsere heutigen Arbeitsweisen verändern. Wir haben zwei neue Betriebsleitfäden entwickelt, die Rahmenbedingungen bieten, mit denen Sie klare Aktionspläne erstellen können, die bei Vorfällen Geschäftsteams in Abstimmung mit technischen Teams mobilisieren.

Was genau ist Business Incident Response?

Ist Ihr CEO auf Abruf verfügbar, wenn Ihre Webdienste ausfallen?

Nein? Das sollten sie aber sein!

Das ist vielleicht ein extremes Beispiel, aber es stimmt, dass das Unternehmen auch über Incident Responder verfügt (der CEO ist im obigen Beispiel einer), unabhängig davon, ob sie derzeit in Ihrer Organisation als solche behandelt werden. Aber das Problem ist, dass diese Geschäftsinteressenten in der Regel auf eigene Faust handeln, obwohl sie stark davon profitieren würden Koordinierung ihrer Reaktion mit technischen Helfern.

Es besteht kein Zweifel, dass technische Vorfälle eine messbare Wirkung auf den Umsatz und den Ruf Ihres Unternehmens. Wenn Geschäftsdienstleistungen gestört werden, sind die Kunden schließlich verärgert. Dies ist besonders dann deutlich zu erkennen, wenn Störungen über längere Zeiträume deutlich sichtbar sind.

Erinnern Sie sich beispielsweise an eine Situation, in der eine wichtige Office-Produktivitätsanwendung mehrere Stunden lang nicht verfügbar war? Oder an den einen Morgen, als Ihre bevorzugte Social-Networking-Site super langsam war? Ohne eine angemessene Reaktion können solche Ereignisse Folgendes verursachen: Reputationsschaden und erhebliche Umsatzeinbußen für ein Unternehmen. Um den Schaden aus beidem zu begrenzen, verlassen sich die Geschäftspartner auf Updates von technischen Incident-Respondern, damit sie proaktiv auf Kundenanliegen reagieren können.

Wenn die technische Reaktion auf Vorfälle unserer Branche etwas beigebracht hat, dann, dass der Schlüssel zur effektiven Bewältigung von Katastrophen darin liegt, explizit definierte Reaktionspläne mit klaren Rollen und Verantwortlichkeiten zu erstellen, die häufig geübt werden. Kurz gesagt, wir müssen uns auf Fehler vorbereiten, indem wir sie ständig proben und daraus lernen, wenn sie auftreten.

Business Incident Response ist eine Anwendung des Incident Response Frameworks von PagerDuty für nicht-technische Einsatzkräfte. Mithilfe dieses Frameworks können Business-Einsatzkräfte eine Reihe expliziter Schritte entwickeln, mit denen sie die geschäftlichen Auswirkungen technischer Vorfälle abmildern können.

Genau wie bei technischen Vorfällen hängt die Reaktion des Unternehmens von der Schwere des Vorfalls ab. Bei kleineren Vorfällen sind möglicherweise lediglich ausführlichere Mitteilungen und Benachrichtigungen an die Beteiligten erforderlich, während bei größeren Vorfällen möglicherweise die Geschäftsleitung und die Rechtsabteilung mitten in der Nacht geweckt werden müssen.

Diese schwerwiegenden Vorfälle ereignen sich ohne Vorwarnung. Die Frage ist also: Sollten Sie auf eine Überraschung mitten in der Nacht warten, um herauszufinden, welche kritischen Entscheidungen getroffen werden müssen, um einen erheblichen Markenschaden für Ihr Unternehmen zu vermeiden? Oder sollten Sie diese Reaktion vorbereiten und mit den kritischen Stakeholdern besprechen, um Lücken zu identifizieren und zu beheben, und klare Bereitschaftsrotationen Und Eskalationsrichtlinien Monate im Voraus definiert?

Ich wette, die meisten Menschen erkennen den Wert bereits im Vorfeld definierter Reaktionspläne mit klaren Rollen, Erwartungen und Eigentümern, insbesondere während einer Krise.

Unsere neuen Betriebsleitfäden für die Reaktion auf Geschäftsvorfälle bieten einen Rahmen für die Entwicklung klarer Aktionspläne, die bei Vorfällen Geschäftsteams in Abstimmung mit technischen Teams mobilisieren. Unabhängig davon, ob Sie größere oder kleinere Vorfälle bewältigen, müssen Sie einen Plan für die Reaktion des Unternehmens haben.

Schritt-für-Schritt-Anleitungen

Unsere neuen Betriebsleitfäden bieten einen Rahmen für die Entwicklung klarer Aktionspläne, die bei Vorfällen Geschäftsteams in Abstimmung mit technischen Teams mobilisieren. Diese beiden Leitfäden werden dazu beitragen, die Reaktionslücke zwischen IT-Teams und Geschäftsteams zu schließen.

Unsere bestehenden Technische Reaktion auf Vorfälle Leitfaden definiert Verantwortlichkeiten für einen Kundenkontakt und ein Interne Verbindung während eines Vorfalls. Die neue Interne Stakeholderkommunikation Der Leitfaden ist ein ergänzendes Handbuch, das effektive Kommunikationspraktiken für Ihre internen Teams genauer erläutert. Der Leitfaden beschreibt Verteilungsmechanismen und Messaging-Überlegungen für verschiedene Medien, z. B. die Verwendung von Mechanismen, die ein flexibles Opt-in zum Empfang von Benachrichtigungen ermöglichen (z. B. eine interne Statusseite) im Gegensatz zu eher statischen Mechanismen wie E-Mail-Verteilerlisten. Er enthält auch Überlegungen zur Präsentation relevanter Ansichten für verschiedene Teile des Unternehmens.

Der Reaktion auf geschäftliche Vorfälle Der Leitfaden konzentriert sich auf die Abmilderung der geschäftlichen Auswirkungen bei der Reaktion auf die schwerwiegendsten technischen Vorfälle. Der Leitfaden befasst sich mit den geschäftlichen Reaktionsvorgängen, die parallel zu den technischen Reaktionsvorgängen erfolgen sollten. Die Reaktion auf geschäftliche Vorfälle besteht aus zwei Hauptfunktionen: 1) Umstellung des normalen Geschäftsbetriebs auf den Notfallmodus und 2) Verwaltung der internen/externen Stakeholder-Kommunikation. Der Leitfaden ist ein ausführlicher Rahmen, der wichtige Rollen und Verfahren sowohl während als auch nach einem schwerwiegenden technischen Vorfall definiert und Ihnen dabei helfen soll, einen Geschäftsreaktionsplan für (hoffentlich) seltene Extremfälle zu entwickeln.

Teilen Sie Ihre Erfahrungen mit uns

Diese Leitfäden sollen Ihnen dabei helfen, Geschäftsreaktionspraktiken zu entwickeln, die mit den bewährten Praktiken von technischen Praktikern übereinstimmen. Und obwohl sie zwei besonders schwierige Szenarien abdecken, mit denen viele Organisationen zu kämpfen haben, erkennen wir, dass dies nur die Spitze des Eisbergs ist, wenn es darum geht, die vielen verschiedenen Szenarien für die Reaktion auf Vorfälle zu definieren, die auf der Geschäftsseite eines Unternehmens anwendbar sind.

Mit welchen anderen Problemen kämpfen Sie? Wie funktioniert die Reaktion auf Geschäftsvorfälle heute in Ihrer Organisation? Wir würden uns freuen, von Ihnen zu hören und die Gelegenheit zu bekommen, Erfahrungen auszutauschen und zu vergleichen, die zur Weiterentwicklung dieser Leitfäden beitragen. Besuchen Sie unsere Gemeinschaft um uns einen Kommentar zu hinterlassen oder mich direkt zu erreichen über Þjórsárden , und lassen Sie uns wissen, was Sie denken!