Der Blog

Durch operative Reife können Sie Millionen sparen

von Jeffrey Hausman 8. Oktober 2024 | 4 Minuten Lesezeit

Am 19. Juli legte ein großflächiger technischer Ausfall den Betrieb in verschiedenen Branchen lahm. Das führte zu Umsatzeinbußen, verschwendeten Betriebskosten und einem Verlust des Kundenvertrauens. Für Unternehmen, die durch die Bereitstellung zuverlässiger und zuverlässiger Dienste Vertrauen aufgebaut hatten, hatte dies sowohl unmittelbare als auch nachhaltige Auswirkungen.

Wir gehen davon aus, dass die Störung vom 19. Juli („Ausfall“) unsere Kunden Milliarden von Dollar gekostet hat, wobei sich die stündlichen Ausfallkosten für einige Unternehmen auf Millionen belaufen. 1 Leider waren die Folgen des Stromausfalls nicht immer innerhalb weniger Stunden messbar, denn die Nachwirkungen waren noch viele Tage nach dem Hauptereignis spürbar.

Die Auswirkungen waren bei verschiedenen Unternehmen unterschiedlich  

Unternehmen mit einer höheren operativen Reife erholten sich schneller und hatten mit 60 % weniger geschäftlichen Auswirkungen zu kämpfen als vergleichbare Unternehmen. 2 PagerDuty Daten haben ergeben, dass betriebserfahrene Kunden sowohl schneller als auch effizienter auf den Ausfall reagierten (mit einer um bis zu 30 % schnelleren mittleren Bestätigungszeit (MTTA)) und verbleibende Probleme proaktiv behoben, bevor sie auftraten. Durch eine stärkere Nutzung der PagerDuty Operations Cloud– mit Rauschunterdrückung zur Fokussierung der Teambemühungen und Automatisierung zur Optimierung und Orchestrierung der gesamten Reaktionsstrategie – konnten unsere Daten zeigen, dass die Teams mehr als 60 % schneller als ihre Kollegen eine Lösung finden konnten, sodass sie schnell zu ihrem normalen Arbeitsablauf zurückkehren konnten. Dies bedeutet potenzielle Einsparungen in Millionenhöhe durch nur ein einziges Ereignis und einen Ruf der Belastbarkeit und Zuverlässigkeit in den Augen ihrer Kunden.

Während Unternehmen diese Erfahrung hinter sich lassen, ist es entscheidend, zu beurteilen, ob sie auf das nächste Ereignis vorbereitet sind. In einer vernetzten Welt, die auf einer technischen Infrastruktur basiert, die sowohl altert als auch durch fortschrittliche Technologien wie generative KI immer komplexer wird, ist die Frage nicht „ob“, sondern „wann“ der nächste Ausfall eintritt.

Vorbereitung ist eine Investition, die sich während einer Krise wie dem Stromausfall nicht von selbst ergibt. Stattdessen müssen Unternehmen fortlaufende Investitionen in die Betriebsreife priorisieren – einschließlich ihrer Betriebsplattform, Prozesse und Mitarbeiter an der Front.

Operative Plattform
Bei einem Ausfall benötigen Unternehmen eine Plattform, der sie vertrauen können und auf die sie sich verlassen können, damit sie auch dann einsatzbereit bleibt, wenn der Rest der Welt nicht betriebsbereit ist. Die PagerDuty Operations Cloud ist die beste Plattform ihrer Klasse mit unübertroffener Zuverlässigkeit.

Am 19. Juli hat die PagerDuty Operations Cloud ihre Widerstandsfähigkeit unter Beweis gestellt. Unsere Daten zeigen, dass unsere Plattform trotz eines exponentiellen Anstiegs des Transaktionsvolumens über den Normalwert (Incident Workflows um 1.400 %) die vereinbarten Service Level Agreements erfüllt. Dadurch konnte PagerDuty eine entscheidende Rolle dabei spielen, Kunden bei der Identifizierung und Lösung zeitkritischer Probleme zu unterstützen, um so schnell wie möglich wieder online zu gehen und die finanziellen und rufschädigenden Auswirkungen auf ihr Unternehmen zu minimieren.

Menschen und Prozesse
Mit dem PagerDuty Betriebsreifemodell
können Kunden einfach ihren aktuellen Reifegrad beurteilen und sich die wichtigsten Empfehlungen für Verbesserungen anzeigen lassen, die auf Peer-Benchmarking basieren. 3 Das Operational Maturity Model enthält Schlüsselkategorien wie Personalmanagement, Lärmreduzierung und Automatisierung, damit Kunden verstehen, wie gut ihre Teams darauf vorbereitet sind, Vorfälle und zeitkritische Arbeiten effizient zu bewältigen. Dadurch wird die operative Reife in großem Maßstab über Dutzende oder Hunderte von Teams hinweg zu einem nahtlosen Teil des täglichen Betriebs, sodass Unternehmen immer auf dem neuesten Stand sind.

Außerhalb der Reaktionsbemühungen ist kontinuierliches Lernen ein wichtiger Bestandteil des Operational Maturity Model. Erfahrenere Organisationen lassen Erfahrungen wie den Ausfall – oder sogar Vorfälle mit weitaus geringerer Berichterstattung – nicht ohne Überprüfung und Analyse im Rückspiegel zurück. Sie nutzen analytische Erkenntnisse und Audits nach Vorfällen, um Stärken und Belastbarkeitsbereiche in ihren Abläufen sowie Möglichkeiten zur Weiterentwicklung zu identifizieren. Die PagerDuty Operations Cloud umfasst diese Analyse- und Nachvorfallüberprüfungsfunktionen, die Unternehmen dabei helfen können, ihre operative Reife zu verbessern und sich von ihren Mitbewerbern abzuheben ( Mehr erfahren Sie hier ).

Beginnen Sie noch heute mit der PagerDuty Operations Cloud , oder erfahren Sie mehr darüber, wie Sie die Reife Ihrer Organisation steigern können mit unserem Betriebsreifemodus m .

 

1 Die Zahlen wurden auf Grundlage der PagerDuty Kunden berechnet, bei denen die Zahl der dringenden Vorfälle um über 100 % zunahm, sowie anhand des relativen Ausmaßes des Anstiegs, der Zeit, die diese Kunden in ihrem erhöhten Vorfallreaktionszustand blieben, und ihres gesamten Jahresumsatzes und ihrer Betriebsausgaben.

2 Diese Zahlen wurden berechnet, indem Kunden, die während des Ausfalls ihre durchschnittliche 180-tägige Problembehebungszeit erreicht oder überschritten haben, mit allen anderen Kunden verglichen wurden.

3 Empfehlungen basierend auf Unternehmen ähnlicher Branchen und Größe.