PagerDuty apporte une meilleure visibilité au site de comparaison de consommateurs Verivox

PagerDuty image

Taille: Plus de 500 employés

Industrie: Technologie

Emplacement: Heidelberg, Allemagne

Client depuis : 2018

Verivox, l'un des principaux sites de comparaison allemands de services publics, de téléphonie mobile, d'assurance et plus encore, dessert plus de huit millions de consommateurs souhaitant comparer les prix et changer de fournisseur de services. Avec autant de clients qui comptent sur Verivox pour leur fournir des informations précises, le site Web de Verivox doit rester stable et fiable. Et avec des concurrents sur ses talons, 13 équipes de développement qui proposent de nouvelles fonctionnalités chaque semaine et ses équipes d'ingénierie dispersées dans tout le pays, l'entreprise avait besoin d'un meilleur moyen de faire évoluer et d'automatiser ses opérations numériques afin de réduire les temps d'arrêt.

Par le passé, Verivox comptait sur son équipe d'ingénierie de fiabilité du site (SRE) pour examiner manuellement les alertes et informer les équipes des incidents. Cependant, les protocoles d'alerte de l'entreprise déclenchaient régulièrement des alertes non valides, ce qui accaparait les ressources et empêchait la visibilité sur l'état du réseau. De plus, avec une seule personne de garde pendant une semaine entière après les heures de bureau (y compris les week-ends), Verivox risquait à la fois d'épuiser son personnel et de manquer des alertes importantes au milieu de la nuit.

« En éliminant les interactions manuelles, PagerDuty a permis à notre processus d'alerte de faire un grand pas en avant. Et nous ne perdons plus la trace des incidents qui affectent la production. »

– Waldemar Spitschak, Responsable SRE, Verivox

Du manuel à l'automatisé

Selon Waldemar Spitschak, responsable de l’ingénierie de fiabilité des sites, « nous avions avant tout besoin de PagerDuty pour automatiser les alertes. » Comme PagerDuty compte plus de 200 intégrations, Verivox a pu facilement connecter la plateforme de gestion des opérations numériques PagerDuty à tous ses outils de surveillance, comme New Relic, Zabbix et AWS Cloudwatch, dans l’ensemble de son environnement de production hybride composé de bases de données, d’applications cloud, de serveurs Windows et Linux, etc.

L'automatisation de PagerDuty a permis à Verivox de mieux définir et attribuer les rôles d'astreinte. L'entreprise peut ainsi immédiatement acheminer les problèmes vers les personnes qui savent comment les résoudre plutôt que de forcer un intermédiaire à décrocher le téléphone et à retrouver quelqu'un. Si l'équipe d'astreinte doit ajouter des ressources supplémentaires pour apporter son aide, elle peut exécuter un jeu de réponse pour appeler automatiquement les bonnes personnes. « En éliminant les interactions manuelles, PagerDuty a permis à notre processus d'alerte de faire un grand pas en avant », a commenté Spitschak. « Et nous ne perdons plus la trace des incidents qui affectent la production. »

« Nous réagissons et résolvons les incidents plus rapidement que jamais, ce qui est vraiment important puisque notre cycle de développement est très court », a-t-il ajouté.

L'automatisation permet également d'équilibrer les pics et les creux du flux de travail saisonnier de Verivox en standardisant le processus d'astreinte et en permettant à l'entreprise de mieux prévoir les coûts. Avec PagerDuty, les équipes d'astreinte offrent désormais la même couverture complète tout au long de l'année, en maintenant un niveau d'expertise constant au-delà de la période de pointe du quatrième trimestre.

Une visibilité améliorée met en lumière les opérations numériques

Grâce à PagerDuty, Verivox a désormais une meilleure compréhension des incidents : l'équipe de Spitschak peut voir le nombre exact d'incidents par service et la rapidité avec laquelle ils sont résolus. Les données les aident à déterminer si la plateforme fonctionne correctement ou si un service particulier est impacté. Grâce aux fonctionnalités API riches de PagerDuty, Verivox peut générer différents rapports et mécanismes d'alerte et définir une maintenance automatisée.

« Avec PagerDuty, nous avons une vision plus globale. Auparavant, nous devions prendre des décisions en nous basant sur notre intuition. Avec PagerDuty, nous avons une vision plus claire de ce qui se passe dans notre environnement de production », a déclaré Spitschak.

La transparence accrue permet également à Verivox d’améliorer la qualité de la surveillance et des alertes. Comme Verivox a supprimé les alertes invalides et héritées de PagerDuty, sa surveillance est désormais bien meilleure qu’avant. Et avec moins d’alertes, Verivox gère moins d’incidents. « Dans le passé, notre système d’alerte envoyait 10 à 20 fois plus d’e-mails que ce dont la personne de garde avait besoin pour agir », a expliqué Spitschak. « Maintenant, le ratio est plutôt de 1:1. »

Regard vers l'avenir

L'entreprise prévoit bientôt de déployer PagerDuty dans toute son organisation et ses filiales. « Avec PagerDuty, nous avons une vision beaucoup plus claire de la santé de notre environnement de production, et nous étudions les avantages de PagerDuty. Console de commande des opérations et Service de gestion opérationnelle de la santé ', a déclaré Spitschak.

Si Verivox a initialement choisi PagerDuty pour ses fonctionnalités d’alerte, l’entreprise l’utilise désormais pour améliorer d’autres dimensions clés de sa gestion des opérations numériques. Et comme obtenir un meilleur retour sur investissement est ce qui aide les entreprises à croissance rapide comme Verivox à rester en tête sur un marché concurrentiel, elle prévoit également d’utiliser PagerDuty pour définir et mesurer des indicateurs de performance clés.

Visite www.pagerduty.com pour plus de détails sur la solution de gestion des opérations numériques de PagerDuty ou pour obtenir des informations, des stratégies et une expérience pratique dans l'un de nos nombreux événements à venir .