Manheim améliore l'agilité des produits et favorise le travail d'équipe collaboratif avec l'aide de PagerDuty
Industrie: Automobile
Emplacement: Atlanta, Géorgie
Client depuis : 2014
Manheim® est le premier fournisseur nord-américain de services de revente de véhicules, reliant les acheteurs et les vendeurs au plus grand marché de vente en gros de véhicules d'occasion et au plus vaste réseau d'enchères. Grâce à ses 115 ventes aux enchères physiques, numériques et mobiles, l'entreprise aide les concessionnaires et les clients commerciaux à obtenir des résultats commerciaux en fournissant des solutions d'inventaire de bout en bout innovantes. Chez Manheim, l'équipe investit massivement dans l'avenir de la livraison de logiciels, qui est un moteur commercial stratégique. Pour faire progresser cet aspect de l'entreprise, Manheim a adopté des pratiques DevOps parallèlement aux opérations informatiques traditionnelles. Jason Riggins, directeur de l'ingénierie de production, est chargé de fournir une orientation stratégique, un leadership et une supervision à un certain nombre d'équipes : ingénierie de publication, opérations de développement et opérations sur site. Ces équipes « d'ingénierie de production » servent de base essentielle pour garantir une livraison de logiciels fiable et, par conséquent, des flux de revenus.
Surmonter le manque de communication en cas d'incidents critiques
Avant la mise en place de PagerDuty , Manheim disposait d'un processus de suivi manuel lorsque des incidents se produisaient et que des applications et services critiques étaient impactés. Les intervenants de garde devaient utiliser un numéro de téléphone Google ou un système téléphonique sur site pour signaler un incident.
Manheim devait suivre le rythme de ses équipes d’ingénierie de production et améliorer ses méthodes de recrutement des bons intervenants en cas d’incident. L’entreprise avait besoin d’une plateforme pouvant être standardisée pour toutes les équipes de développement. Le défi était que l’entreprise était très cloisonnée en raison de changements organisationnels antérieurs. Cette nature cloisonnée spécifique au sein des opérations informatiques devenait de plus en plus difficile pour Manheim : « Nous étions moins agiles. Nous avions des tickets accumulés dans la file d’attente, des problèmes dus à des équipes cloisonnées et un fossé de communication qui s’était créé entre les différentes unités », a déclaré Riggins. « Il fallait que quelque chose change pour que nous restions à la pointe. »
«PagerDuty était globalement un produit plus mature, c'est pourquoi nous l'avons choisi. »
– Jason Riggins , Directeur de l'ingénierie de production, Manheim
Recruter les bonnes personnes, avec les bonnes informations pour réduire les temps d'arrêt
« Nous avons fait une comparaison entre PagerDuty et l’un de leurs concurrents. L’une des raisons pour lesquelles nous avons choisi PagerDuty est l’expérience qu’ils avaient déjà acquise dans le secteur et la base de clients éprouvée qui existait. PagerDuty était globalement une plateforme plus mature et plus riche en fonctionnalités, c’est pourquoi nous les avons choisis », a déclaré Riggins.
Depuis, Manheim a changé sa façon de développer des logiciels et a amélioré ses capacités de support et de réponse informatique. « Une grande partie de ces changements qui ont un impact sur l’entreprise est liée à l’utilisation de PagerDuty , car cela nous a permis de gagner en efficacité », a déclaré Riggins. Actuellement, l’organisation utilise PagerDuty pour la gestion des incidents de divers services, la planification des astreintes, les politiques d’escalade, la gestion des événements et une intégration API personnalisée. La possibilité de personnaliser les notifications, la planification et les politiques d’escalade aide Manheim à recruter la bonne équipe, à chaque fois, tandis que la fonction de gestion des événements permet à Manheim de regrouper les incidents et de réduire le temps moyen de résolution (MTTR). La mise en œuvre de PagerDuty a permis à Riggins et à ses équipes d’attribuer de manière transparente les charges de travail et les incidents aux équipes appropriées. L’organisation ne dépendait plus d’une équipe qui ouvrait des tickets lorsqu’un incident se produisait, puis attendait qu’une autre équipe réponde. « Avec PagerDuty, la puissance de la gestion des incidents au sein des équipes et entre elles leur permet de développer leurs propres politiques d’escalade et de s’autogérer », a déclaré Riggins. Grâce à ces avantages ayant un impact sur l’entreprise et à un retour sur investissement tangible, Manheim continue de développer sa mise en œuvre de PagerDuty.
Lorsque Manheim a commencé à chercher une solution, ils ont découvert que PagerDuty les aidait à automatiser le travail de leurs équipes en dehors des heures de travail. «PagerDuty nous a permis de déplacer les effectifs dédiés en dehors des heures de travail vers la journée, ce qui a augmenté la productivité globale », a déclaré Riggins. C'est à ce moment-là que l'entreprise est passée à un modèle d'équipe de compétences qui est passé à un modèle « vous le construisez, vous l'exécutez ». L'équipe développe le logiciel et le supporte, et PagerDuty aide à la surveillance et à l'alerte de l'application, augmentant ainsi la disponibilité globale. L'Enterprise Operation Center (EOC) identifie les principales alertes critiques qui arrivent avec une réponse immédiate pour chaque équipe DevOps, plutôt que de leur envoyer chaque alerte individuellement. Si un développeur d'astreinte manque une alerte, il ajoute l'équipe EOC à la politique d'escalade, servant ainsi d'autre ligne de défense pour l'organisation.
PagerDuty offre également à Manheim un autre avantage : les intégrations prêtes à l'emploi avec Datadog, New Relic et Amazon Cloud Watch. « Nous disposons d'une suite d'outils de surveillance et PagerDuty nous permet d'être plus proactifs et plus rapides », a déclaré Riggins. Il fut un temps où l'organisation déployait un changement et où ses niveaux de service chutaient, les files d'attente étaient encombrées et le temps de réponse n'était pas là où elle le souhaitait. Manheim a désormais standardisé la pile d'opérations PagerDuty, Datadog et New Relic.
Trouver une solution de gestion des incidents complète et agile
PagerDuty permet à Manheim de se connecter aux services informatiques critiques et de générer des données d’événements avec les bonnes équipes au bon moment, ce qui augmente leur agilité opérationnelle et leur efficacité informatique. Dans l’ensemble, la solution de gestion des incidents de niveau entreprise a amélioré la confiance et la communication au sein de l’organisation. «PagerDuty va finir par augmenter le nombre d’utilisateurs et devenir la norme. Nous comptons sur la stabilité et la précision que nous obtenons grâce à PagerDuty. Si vous supprimiez la solution, nous serions revenus à la case départ », a déclaré Riggins.