Comment les détaillants améliorent leur productivité, transforment la réponse aux incidents et responsabilisent les équipes avec PagerDuty
Pour les détaillants, le temps de disponibilité est de l'argent et les problèmes peuvent coûter cher des milliers de dollars par minute Avec une infrastructure comprenant des services complexes tels que des passerelles de paiement, des inventaires et des applications mobiles, la maturation des opérations numériques est essentielle pour garantir que les services sont toujours disponibles et que les clients bénéficient de la meilleure expérience.
Lors de notre Sommet 2021, des représentants de détaillants Compagnie de la Baie d'Hudson , Bunnings , et Loblaw a expliqué comment PagerDuty les aide à responsabiliser les équipes, à obtenir une visibilité et à résoudre les problèmes de manière proactive.
Améliorer la productivité et la satisfaction des employés grâce à la suppression du bruit
Groupe de commerce de détail canadien Compagnie de la Baie d'Hudson utilise PagerDuty pour une réponse aux incidents de bout en bout sur ses 100 services.
Elle a constaté que ses équipes recevaient trop d’alertes. Sans cartographie des priorités, des alertes inutiles réveillaient souvent les gens la nuit. Pour réduire cette lassitude face aux alertes, la première étape consistait à collecter des données. La société a extrait l'historique des alertes d'un an de PagerDuty et identifié les services générant le plus de bruit. Il s’est avéré que les quatre principaux services d’alerte ont généré 80 % des alertes. Ensuite, l'équipe a rencontré les propriétaires de services pour créer des stratégies autour de la gestion des alertes. Ils l'ont fait de quatre manières :
- Prioriser les alertes : Les propriétaires de services ont attribué aux incidents nécessitant une reconnaissance un niveau de priorité P1 ou P2 et ont envoyé des alertes P3 ou P4 moins urgentes par courrier électronique et d'autres canaux moins perturbateurs.
- Émettre des avertissements au lieu d'alertes : Les équipes ont remplacé les alertes de très faible priorité (telles que la mémoire du serveur ou l’utilisation du processeur) par des avertissements souples.
- Alertes de groupe en fonction de l'heure ou du type : Les propriétaires de services ont décidé du nombre d'alertes nécessaires avant d'émettre une notification via la plateforme PagerDuty pour les services plus bruyants.
- Améliorer la taxonomie : En standardisant le langage des incidents, l’entreprise a réduit la confusion et amélioré la collaboration entre les équipes.
Au cours du projet de six mois, La Baie d'Hudson a réduit toutes les alertes de 61 %, soit environ 8 000 en tout. Les quatre principaux services ont réduit les alertes de 76 %, soit environ 5 500. Le temps moyen de reconnaissance (MTTA) s'est amélioré de 38 %, la plupart des incidents étant reconnus dans un délai de trois à quatre minutes. Les équipes ont été ravies des résultats et l'entreprise examine régulièrement ses données pour trouver de nouvelles façons de s'améliorer.
Transformer la réponse aux incidents
Chaîne australienne de quincaillerie grand public Bunnings souhaitait intégrer sa fonction de commerce électronique en interne et avait besoin d'une plateforme de gestion des opérations numériques pour soutenir ses objectifs. Comme de nombreux détaillants, il disposait d'un écosystème technologique complexe et interconnecté, comprenant des solutions d'inventaire, des outils d'authentification et d'autorisation de sites Web et des plateformes de tarification.
Le projet était l'occasion de passer à des technologies alternatives, et Bunnings souhaitait un système qui lui permettrait d'intégrer facilement de nouvelles applications. Bunnings a également remarqué une augmentation significative des incidents lors de campagnes marketing ou suite à des changements de prix, et cherchait un moyen d'étendre son processus de réponse aux incidents. Il s'est tourné vers PagerDuty pour obtenir de l'aide.
Grâce à la gestion intelligente des événements de PagerDuty, Bunnings a rapidement mis en œuvre des améliorations majeures à son processus de gestion des incidents. Il a mappé les priorités aux alertes, ce qui a instantanément réduit le bruit des alertes et amélioré la collaboration et la communication des équipes en synchronisant les notes entre les incidents. PagerDuty a également permis à Bunnings d'améliorer les rotations d'astreinte et les politiques d'escalade, et de résoudre plus rapidement les problèmes complexes. Par exemple, PagerDuty a aidé l'équipe à corréler les problèmes affectant des applications interdépendantes telles que la recherche de localisation, le paiement et la tarification.
Avec PagerDuty, Bunnings dispose désormais d'une visibilité complète du système et d'un processus de réponse aux incidents efficace qui lui permet de mesurer avec précision le MTTA et le temps moyen de résolution (MTTR), et de garantir que les alertes parviennent aux bonnes équipes. Les ingénieurs sont habilités à s’approprier la mise à jour des bases de données d’informations sur les services techniques. Ces informations aident l’équipe commerciale et d’assistance à déterminer avec précision l’impact d’un problème.
Optimisez l'expérience client grâce aux opérations en temps réel
La pandémie a exercé plus de pression que jamais sur les détaillants, alors que les magasins physiques ont vu le trafic se déplacer vers les achats en ligne. Avec cette charge accrue, de nombreux détaillants ont été confrontés à des défis sans précédent pour garantir la disponibilité sur toutes les plateformes. Comme l'ont montré nos présentateurs du Sommet, travailler avec PagerDuty peut aider à résoudre les problèmes de manière proactive afin de protéger les résultats et de garantir que les services de commerce électronique restent toujours disponibles.
Donner aux équipes les moyens d'agir grâce à une ingénierie autonome
Loblaw est une chaîne canadienne de supermarchés et de pharmacies comptant plus de 2 400 magasins dans tout le pays. Depuis le lancement d'une entreprise de commerce électronique en 2012, sa branche de développement Loblaw Digital est progressivement passée à un modèle de propriété à service complet [MA1]. Le détaillant travaille avec PagerDuty pour redéfinir ses processus de gestion des incidents.
Auparavant, les équipes de développement de Loblaw s’appuyaient sur une gestion centralisée des changements et une orchestration des réponses. À mesure que son activité de commerce électronique s’est développée et que ses équipes se sont agrandies, il est devenu évident que cette approche était inefficace et non viable. Par exemple, si une équipe voulait effectuer un déploiement, elle devait soumettre une demande plusieurs jours à l’avance et était soumise à un long processus d’approbation. De même, des alertes d’incident étaient envoyées à toutes les équipes, ce qui entraînait un chaos d’alertes. Afin de travailler plus intelligemment, Loblaw Digital devait devenir autonome.
Le passage à un modèle de propriété à service complet a radicalement transformé les processus de gestion des incidents et de gestion du changement. Avec l'aide de PagerDuty, les équipes peuvent désormais résoudre leurs propres incidents rapidement et tenir leurs collègues informés sans avoir besoin de longs appels de groupe. Les équipes avaient également la flexibilité de se déployer tout au long de la journée sans avoir à se soucier d'une chaîne complexe d'approbations.
Lorsque la pandémie a frappé en 2020, Loblaw a vu son trafic en ligne décupler et les incidents ont explosé. Loblaw Digital estime que son approche autonome a permis aux équipes d'être plus résilientes et plus agiles face à des circonstances changeantes. Tout le travail avec PagerDuty pour responsabiliser les équipes, stabiliser les systèmes, gérer les alertes et établir des rotations d'astreinte et des politiques d'escalade, les place dans une position idéale pour gérer la charge.