SAP revolutioniert mit PagerDuty die schnelle Reaktion auf schwerwiegende Vorfälle
Größe: Mehr als 100.000 Mitarbeiter
Industrie: Technologie
Standort: Wo ist Walldorf, Deutschland
Kunde seit: 2019
SAP ist Marktführer für Unternehmenssoftware und hat Kunden in über 180 Ländern. Mehr als drei Viertel des weltweiten Transaktionsumsatzes laufen über ein SAP-System.
In den letzten Jahren hat SAP sein Geschäft digital umgestaltet und kundenorientierte Dienste in die Cloud verlagert. Als Teil seiner Rolle im Globale Cloud-Dienste Mitchell Rose, Senior Program Manager im GCS-Team, ist für die weltweite Verfügbarkeit dieser Dienste verantwortlich. „Die Vision von SAP ist es, die Abläufe auf der Welt zu verbessern und das Leben der Menschen zu erleichtern“, erklärt er. „Dazu müssen wir jedoch sicherstellen, dass es weniger – und weniger schwerwiegende – Cloud-Ausfälle und -Vorfälle gibt, die unsere Kunden betreffen.“
Die Vision des Global Cloud Services-Teams besteht darin, Technologieteams innerhalb von SAP dabei zu unterstützen, durch intelligentes Ausfallmanagement sicherzustellen, dass ihre Cloud-Dienste und -Infrastruktur immer verfügbar sind. „Dazu mussten wir einen Service für Großereignisse schaffen, der auf SAP-Ebene skalierbar ist und uns hilft, die Verfügbarkeit von Diensten wie Ariba, Concur und Fieldglass sicherzustellen“, sagte Rose.
Herausforderungen erschwerten die Reaktion auf größere Vorfälle
Angesichts der oben genannten Herausforderungen war dem Team klar, dass die Entwicklung und Einführung eines solchen Dienstes in einem Unternehmen von der Größe von SAP eine Herausforderung sein würde. Viele Teams verwendeten interne Tools, die auf die jeweiligen Technologieteams zugeschnitten waren. Diese waren jedoch nicht auf das gesamte Unternehmen skalierbar. Im Laufe der Jahre führten die Übernahmen durch SAP dazu, dass im gesamten Unternehmen unterschiedliche Tools und Prozesse verwendet wurden, was die Zusammenarbeit und den Zusammenhalt erschwerte.
„In den Teams gab es sehr unterschiedliche Betriebsmodelle“, erklärte Rose. „Es gab Unterschiede in den Betriebsdefinitionen und das Wort ‚Priorität‘ hatte für verschiedene Teams unterschiedliche Bedeutungen. Sie hatten auch unterschiedliche Ticketsysteme, ChatOps-Tools, Prozesse und Praktiken. Um erfolgreich zu sein, brauchten wir eine erstklassige Plattform, die unserer Vision für die Reaktion auf größere Vorfälle entsprach. Aus diesem Grund haben wir PagerDuty eingeführt.“
PagerDuty beschleunigt die Reaktion auf größere Vorfälle
Das Global Cloud Services-Team von SAP verwendet PagerDuty , um die Reaktion auf größere Vorfälle zu orchestrieren. Seit der Einführung von PagerDuty hat SAP die Handhabung größerer Vorfälle verbessert und die anfänglichen Reaktions- und Kommunikationszeiten bei kritischen Vorfällen um 30 % und die Lösungszeiten um 26 % in zwei Monaten verkürzt.
„Wir haben die Auswirkungen und die Dauer schwerwiegender Vorfälle erfolgreich reduziert“, so Rose. „Mit PagerDuty können wir die richtigen Leute zum richtigen Zeitpunkt für die richtigen Probleme einsetzen. Dadurch konnten wir die Anzahl der Mitarbeiter, die zur Lösung schwerwiegender Vorfälle benötigt werden, in nur zwei Monaten um 25 % reduzieren.“
PagerDuty hat auch dazu beigetragen, Kommunikation zwischen Teams und Stakeholdern. Wenn SAP kritische, kundenrelevante Vorfälle, wie etwa Störungen bei Cloud-Diensten, priorisieren muss, aktiviert SAP den „SWAT“-Modus, sein internes Verfahren zur Reaktion auf kritische Situationen. Das SWAT-Team steuert dann die interne Unternehmenskommunikation, einschließlich der für die Kundenkommunikation Verantwortlichen.
Über PagerDuty hat das SWAT-Team Zugriff auf Echtzeitinformationen zum Status eines Vorfalls und kann so andere Beteiligte – einschließlich der Geschäftsleitung – auf dem Laufenden halten. Entscheidungen zum Aktivieren des SWAT-Modus werden dadurch schneller getroffen, was in vielen Fällen dazu beiträgt, die Reaktionszeit bei größeren Vorfällen von Stunden auf Minuten zu verkürzen.
Förderung einer stärkeren Zusammenarbeit und Eigenverantwortung
GCS hat PagerDuty zu einem zentralen Bestandteil seines Rahmenwerks für schwerwiegende Vorfälle gemacht, um eine bessere Zusammenarbeit mit Major Incident Management (MIM)-Teams in SAP zu ermöglichen. Wenn jetzt ein schwerwiegender Vorfall eintritt, wird das entsprechende Team – beispielsweise das SuccessFactors- oder Ariba MIM-Team – benachrichtigt, um bei der Koordinierung der besten Reaktion zu helfen.
„PagerDuty hat uns geholfen, unsere Kerngeschäfts- und Technologieteams auf ein gemeinsames Betriebsmodell für die Reaktion auf größere Vorfälle auszurichten“, sagte Rose. „Durch die Verwendung eines gemeinsamen Rahmens haben wir uns auf Prozesse und Kriterien für Schweregrad und Priorität geeinigt. Wir schaffen außerdem eine klare Verantwortung für die Dienste während eines größeren Vorfalls, die auf SAP-Ebene skaliert wurde.“
„PagerDuty ist für SAP geschäftskritisch geworden.“
– Mitchell Rose , Senior Program Manager, SAP
Vorteile mit PagerDuty
Seit der Implementierung von PagerDuty konnte das Global Cloud Services-Team von SAP seine Betriebsabläufe optimieren. Dies bringt unter anderem folgende Vorteile:
- Die Fähigkeit, die richtigen Personen in Echtzeit mit den richtigen Informationen zu versorgen und so die Reaktion auf größere Vorfälle zu optimieren
- Eine Reduzierung der Zahl der bei Großschadenslagen benötigten Einsatzkräfte um 25 % innerhalb von zwei Monaten
- Bessere teamübergreifende Zusammenarbeit und Verantwortung für die Dienste
- Verbesserte Echtzeitkommunikation mit dem gesamten Unternehmen über schwerwiegende Vorfälle, was zur Einhaltung interner Leistungs-SLAs beiträgt
- Reduzierung der Auswirkungen und Dauer schwerwiegender Vorfälle: Die Reaktionszeiten wurden um 30 % und die Lösungszeiten um 26 % verkürzt.
- Nahtlose Integration mit verschiedenen kommerziellen und internen Tools
„PagerDuty ist für SAP von entscheidender Bedeutung geworden. Es ermöglicht unseren Teams die Zusammenarbeit und schnelle Reaktion auf größere Vorfälle und hilft uns, SAP-Kunden weiterhin digitale Dienste der Spitzenklasse bereitzustellen“, so Rose abschließend.
Zukunftsorientiert
Das Global Cloud Services-Team von SAP arbeitet intensiv an der Verbesserung der Fehlerbehebung bei Vorfällen und wird Postmortem-Berichte von PagerDuty sowie vergangene Vorfälle verwenden, um aktuelle Probleme zu beheben. Darüber hinaus möchte SAP seinen Prozess zur Reaktion auf größere Vorfälle weiter automatisieren, indem es automatisierte Runbooks erstellt, die mit PagerDuty auf wichtige Kennzahlen zur Geschäftsauswirkung abgestimmt sind.
Um zu erfahren, wie PagerDuty Ihrem Team helfen kann, Abläufe in einer digitalisierten Welt zu vereinfachen und umzugestalten, Kontaktieren Sie Ihren Account Manager oder versuchen Sie eine 14 Tage kostenlos testen Heute.