Pantheon dépasse son SLA de disponibilité de 99,9 % grâce à PagerDuty

PagerDuty image

Taille: 100+ employés

Industrie: Technologies de l'information et services

Emplacement: San Francisco, Californie

Client depuis : 2011

Fondée en 2010, Panthéon est la plateforme de gestion de sites Web pour Drupal et WordPress. Plus qu'un simple hébergement, la plateforme de Pantheon comprend tous les outils dont les développeurs professionnels ont besoin pour créer des sites Web de premier ordre, comme des environnements de test, le contrôle de version, les sauvegardes et les flux de travail.

Nick Stielau est le directeur de l'ingénierie chez Pantheon. Il est chargé d'organiser l'équipe d'ingénierie, de fournir un soutien à la planification, de fournir de nouveaux produits et fonctionnalités, ainsi que de maintenir l'infrastructure existante et de prendre en charge les fonctionnalités existantes. Alors que Pantheon continue de développer sa clientèle, la mise en œuvre d'une solution de gestion des incidents était essentielle pour l'aider à gérer ses ressources d'astreinte et à répondre à ses attentes en matière de SLA en matière de disponibilité élevée.

Remplacer leur outil d'alerte précédent par une solution plus évolutive

Depuis que Pantheon a mis en œuvre PagerDuty, l'entreprise n'a rencontré aucun problème ni obstacle dans la prise en charge de ses ressources de gestion des incidents. Avant d'utiliser PagerDuty, elle avait mis en place un outil d'alerte personnalisé qui ne s'adaptait pas à ses besoins à mesure que ses équipes d'ingénierie et de réussite client se développaient. Lorsque des problèmes sont survenus, l'équipe voulait s'assurer qu'elle disposait des outils et des systèmes appropriés pour pouvoir répondre aux incidents 24 heures sur 24, 7 jours sur 7, et avait besoin d'une solution à la fois extrêmement fiable et capable de s'adapter à son évolution.

«PagerDuty nous donne la possibilité de servir nos clients internationaux 24 heures sur 24, 7 jours sur 7, à la fois en matière d'infrastructure et de problèmes clients. »

– Nick Stielau, Directeur de l'ingénierie, Panthéon

Servir les clients 24h/24 et 7j/7 et dépasser les attentes en matière de disponibilité

« C'était extrêmement agréable d'avoir PagerDuty dès le début. Nous n'avons pas eu à gérer les principaux problèmes rencontrés par la plupart des entreprises lors de la gestion des incidents. C'est l'une des solutions qui nous a aidés à créer une équipe partageant les mêmes idées sur le plan opérationnel », a déclaré Nick Stielau. Pantheon utilise actuellement PagerDuty pour la gestion des alertes, l'automatisation des astreintes avec planification et escalade, l'orchestration des réponses en temps réel, ainsi que la création de rapports sur les mesures d'efficacité opérationnelle et au niveau du système. PagerDuty a aidé Pantheon à opérationnaliser et à améliorer l'efficacité et la collaboration entre les services, en particulier au sein des équipes d'ingénierie et de réussite client. Les ingénieurs d'astreinte sont responsables de la gestion et du tri des alertes provenant de leurs piles de surveillance d'infrastructure. Pendant ce temps, l'équipe de réussite client est d'astreinte pour les tickets et les appels des clients, et gère la communication client en temps réel et les mises à jour des pannes via sa page d'état. La mise en œuvre de PagerDuty a également permis à l'entreprise de fournir une boucle de rétroaction fonctionnelle et positive pour les clients et leurs équipes. «PagerDuty nous donne la possibilité de servir nos clients internationaux 24 heures sur 24, 7 jours sur 7, à la fois en matière d'infrastructure et de gestion des clients », a déclaré Stielau.

PagerDuty propose des centaines d'intégrations et d'extensions en libre-service avec des outils de surveillance, de billetterie, de déploiement et de collaboration, afin que les clients puissent facilement personnaliser le flux de travail de résolution d'incident idéal pour n'importe quel environnement. Pantheon utilise notamment les intégrations de PagerDuty avec Slack et Sensu. Avec Slack, les ingénieurs d'astreinte et le personnel d'assistance peuvent immédiatement être informés, accuser réception, répondre et collaborer sur les incidents directement dans Slack sans avoir à basculer entre les outils, ainsi qu'étiqueter les équipes appropriées pour une aide supplémentaire. Pantheon a également intégré Sensu à PagerDuty pour regrouper ses demandes d'assistance client. PagerDuty permet une orchestration idéale des réponses en temps réel, en acheminant automatiquement le problème vers la bonne personne en fonction de l'importance du service et de la gravité de l'incident, et en faisant remonter le problème à la ligne de défense suivante s'il n'est pas traité.

La plateforme PagerDuty permet à Pantheon de minimiser le temps consacré aux tâches administratives et de libérer les équipes pour qu'elles puissent concentrer leur attention et leur énergie sur la résolution efficace des problèmes et l'innovation de solutions. PagerDuty leur permet de continuer à servir leurs clients 24 heures sur 24, 7 jours sur 7. « L'un de nos principaux indicateurs clés de performance est la disponibilité du site. PagerDuty est un élément essentiel du système et des processus qui nous aident à maintenir cette disponibilité au niveau souhaité, ce qui nous permet de dépasser notre SLA de disponibilité de 99,9 % », a déclaré Stielau.

« L'un de nos principaux indicateurs de performance clés est la disponibilité du site. PagerDuty est un élément essentiel du système et des processus qui nous aident à maintenir cette disponibilité au niveau souhaité, ce qui nous permet de dépasser notre SLA de disponibilité de 99,9 %. »

 

– Nick Stielau, Directeur de l'ingénierie, Panthéon

 

Respecter leur engagement en matière de disponibilité et de performances

« L'un des atouts majeurs de Pantheon est son engagement quotidien envers la réussite de ses clients. PagerDuty nous aide à respecter nos engagements en matière de disponibilité et de performances », a déclaré Stielau. Sans PagerDuty pour soutenir son processus de prévention et de résolution des incidents, il serait difficile pour l'entreprise de servir ses clients efficacement et cela ajouterait de la frustration aux personnes responsables du produit et de l'expérience client. PagerDuty permet de soulager le stress associé à la disponibilité : « il y a littéralement toujours quelqu'un à qui vous pouvez faire remonter un incident. Si vous êtes vraiment indisposé ou avez besoin d'aide, PagerDuty vous aide à codifier cette assistance », a déclaré Stielau.

Pour en savoir plus sur la manière dont PagerDuty peut aider votre entreprise, contactez votre gestionnaire de compte et Essayez dès aujourd'hui un essai de 14 jours de PagerDuty .