SAP révolutionne les processus de réponse rapide aux incidents majeurs avec PagerDuty
Taille: Plus de 100 000 employés
Industrie: Technologie
Emplacement: Walldorf, Allemagne
Client depuis : 2019
SAP est le leader du marché des logiciels d'application d'entreprise, avec des clients dans plus de 180 pays. Plus des trois quarts des revenus de transactions mondiaux sont générés par un système SAP.
Ces dernières années, SAP s'est lancée dans une transformation numérique de ses activités et a transféré les services orientés client vers le cloud. Dans le cadre de son rôle au sein de Services Cloud mondiaux Mitchell Rose, responsable de programme senior au sein de l'équipe (GCS), est responsable de la disponibilité globale de ces services. « La vision de SAP est d'aider le monde à mieux fonctionner et à améliorer la vie des gens », a-t-il expliqué, « mais pour y parvenir, nous devons nous assurer qu'il y aura moins de pannes et d'incidents cloud qui affectent nos clients et qui auront moins d'impact. »
L'équipe Global Cloud Services a pour objectif d'aider les équipes technologiques de SAP à garantir que leurs services et infrastructures cloud restent toujours opérationnels grâce à une gestion intelligente des pannes. « Cela impliquait de créer un service de gestion des incidents majeurs pouvant évoluer au niveau de SAP, nous aidant ainsi à garantir la disponibilité de services tels qu'Ariba, Concur et Fieldglass », a déclaré M. Rose.
Les défis entravent la réponse aux incidents majeurs
Compte tenu des défis susmentionnés, l'équipe savait que le développement et le déploiement d'un tel service dans une organisation de la taille de SAP seraient difficiles. De nombreuses équipes utilisaient des outils internes personnalisés pour leurs équipes technologiques respectives, mais ils n'étaient pas évolutifs à l'échelle de l'ensemble de l'organisation. Au fil des ans, les acquisitions de SAP ont conduit à l'utilisation de différents outils et processus dans toute l'organisation, ce qui a rendu la collaboration et la cohésion difficiles.
« Les modèles opérationnels étaient très différents d’une équipe à l’autre », explique Rose. « Les définitions opérationnelles étaient différentes et le mot « priorité » avait des significations différentes selon les équipes. Elles disposaient également de systèmes de gestion des tickets, d’outils ChatOps, de processus et de pratiques différents. Pour réussir, nous avions besoin d’une plateforme de pointe qui correspondait à notre vision de la réponse aux incidents majeurs. C’est pourquoi nous avons adopté PagerDuty. »
PagerDuty permet d'accélérer la réponse aux incidents majeurs
L'équipe Global Cloud Services de SAP utilise PagerDuty pour orchestrer sa réponse aux incidents majeurs. Depuis l'adoption de PagerDuty, SAP a amélioré sa gestion des incidents majeurs, réduisant les délais de réponse et de communication initiaux aux incidents critiques de 30 % et les délais de résolution de 26 % en deux mois.
« Nous avons réussi à réduire l'impact et la durée des incidents majeurs », a déclaré Rose. « Avec PagerDuty, nous sommes en mesure d'engager les bonnes personnes, sur les bons problèmes, au bon moment. En conséquence, nous avons réduit le nombre de personnes nécessaires pour résoudre les incidents majeurs de 25 % en seulement deux mois. »
PagerDuty a également contribué à améliorer communication entre les équipes et les parties prenantes. Lorsque SAP doit trier des incidents critiques ayant un impact sur les clients, tels que des interruptions de service cloud, SAP active le mode « SWAT », sa procédure interne de réponse critique. L'équipe SWAT gère ensuite les communications internes de l'entreprise, y compris celles responsables des communications avec les clients.
Grâce à PagerDuty, l'équipe SWAT a accès à des informations en temps réel sur l'état d'un incident, ce qui lui permet de tenir les autres parties prenantes, y compris la haute direction, informées. Les décisions d'engager le mode SWAT sont ainsi prises plus rapidement, ce qui permet de réduire le temps de réponse aux incidents majeurs de plusieurs heures à quelques minutes dans de nombreux cas.
Favoriser une plus grande collaboration et une plus grande appropriation
GCS a fait de PagerDuty un élément clé de son cadre de gestion des incidents majeurs afin de mieux collaborer avec les équipes de gestion des incidents majeurs (MIM) de SAP. Désormais, lorsqu'un incident majeur se produit, l'équipe concernée, comme l'équipe SuccessFactors ou Ariba MIM, est avertie pour aider à coordonner la meilleure réponse.
«PagerDuty nous a aidé à aligner les équipes métier et technologiques autour d'un modèle opérationnel commun pour la réponse aux incidents majeurs », a déclaré Rose. « En utilisant un cadre commun, nous avons aligné nos processus et nos critères de gravité et de priorité. Nous définissons également clairement la responsabilité des services lors d'un incident majeur, qui a été mis à l'échelle au niveau SAP. »
«PagerDuty est devenu essentiel pour SAP. »
– Mitchell Rose , Chef de programme principal, SAP
Avantages avec PagerDuty
Depuis la mise en œuvre de PagerDuty, l'équipe Global Cloud Services de SAP a amélioré son excellence opérationnelle, avec les avantages suivants :
- La capacité d'engager les bonnes personnes avec les bonnes informations en temps réel, optimisant ainsi la réponse aux incidents majeurs
- Une réduction de 25 % du nombre d'intervenants nécessaires en cas d'incidents majeurs, d'ici deux mois
- Meilleure collaboration entre les équipes et appropriation des services
- Amélioration de la communication en temps réel avec l'ensemble de l'entreprise sur les incidents majeurs, contribuant ainsi à atteindre les SLA de performance internes
- Réduction de l'impact et de la durée des incidents majeurs, avec des délais de réponse réduits de 30 % et des délais de résolution réduits de 26 %
- Intégration transparente avec divers outils commerciaux et internes
«PagerDuty est devenu essentiel pour SAP, permettant à nos équipes de collaborer et de réagir rapidement aux incidents majeurs, et nous aidant à continuer à fournir aux clients SAP des services numériques de classe mondiale », a conclu Rose.
Regard vers l'avenir
L'équipe Global Cloud Services de SAP travaille dur pour améliorer la résolution des incidents et utilisera les rapports post-mortem de PagerDuty , ainsi que les incidents passés, pour aider à résoudre les problèmes actuels. En outre, SAP souhaite automatiser davantage son processus de réponse aux incidents majeurs en créant des runbooks automatisés, alignés sur les mesures clés d'impact sur l'entreprise à l'aide de PagerDuty.
Pour découvrir comment PagerDuty peut aider votre équipe à simplifier et à transformer ses opérations dans un monde numérique, contactez votre gestionnaire de compte ou essayez un Essai gratuit de 14 jours aujourd'hui.