PagerDuty image

Groww choisit PagerDuty pour une meilleure expérience DevOps

PagerDuty image

Taille: 1 001 à 5 000 employés

Industrie: Services financiers

Emplacement: Bangalore, Inde

Client depuis : 2022

Intégrations clés :

Plateforme Google Cloud
Prométhée
Nouvelle relique
Grafana

Fondée en 2017, Croissance est une plateforme d'investissement qui permet aux utilisateurs d'investir dans des actions, des fonds communs de placement, des ETF et de l'or de manière simple, sans papier et sans tracas. La FinTech est l'une des plateformes d'investissement à la croissance la plus rapide en Inde et a atteint le statut de licorne en rendant l'investissement simple et transparent pour les nouveaux investisseurs.

Fonctionnant sous un propriété du service Dans le cadre de ce modèle, l'équipe DevOps est responsable de plusieurs services essentiels à la mission, notamment les services d'authentification et de paiement. L'équipe doit également s'assurer que les clients peuvent consulter les données du marché en temps réel et passer des commandes. Au cours de l'année écoulée, la startup a atteint plus de 30 millions d'utilisateurs et a augmenté son personnel d'ingénierie de plus de 65 % pour soutenir sa croissance rapide.

Aman Khare, ingénieur DevOps, contribue à la prise en charge de l'infrastructure et de la sécurité de la plateforme. « Nous nous assurons que l'infrastructure est opérationnelle. Nous veillons à ce que nos clients bénéficient de la meilleure expérience possible sur notre plateforme », a-t-il déclaré.

Travail après les heures de travail de DevOps

Groww avait mis en place une solution de gestion des astreintes, mais elle n'était pas toujours fiable en cas d'incident, surtout en dehors des heures normales de travail. Les ingénieurs DevOps manquaient parfois les notifications par e-mail et Slack au milieu de la nuit. « Nous ne pouvions pas compter sur Slack pour les notifications tard dans la nuit, et le temps de reconnaissance était assez long », a expliqué Khare.

L'implication d'autres intervenants ou experts en la matière lors d'incidents critiques nécessitait un effort manuel de la part de l'équipe. Plus frustrant encore, il était possible qu'une équipe entière reçoive une alerte indiquant que l'ingénieur de garde n'avait pas reçu d'e-mail à ce sujet. Ces situations nécessitaient de retrouver les bonnes personnes, ce qui ralentissait le temps de résolution.

De plus, l'équipe n'avait aucun moyen de supprimer les alertes en fonction de certaines conditions comme la gravité. Certaines alertes n'étaient pas pertinentes en dehors des heures de travail et pouvaient attendre le lendemain pour être traitées. Trop de bruit rendait difficile pour les ingénieurs de se concentrer sur ce qui comptait.

Ces défis ont rendu l’expérience de travail d’astreinte difficile pour l’équipe DevOps. Il est devenu évident que l’équipe avait besoin d’un meilleur processus de réponse aux incidents qui puisse évoluer avec l’entreprise. « Nous avions besoin de quelque chose qui puisse améliorer l’expérience de nos développeurs », explique Khare.

Un outil fiable pour des résultats fiables

Après avoir exploré d’autres options, l’équipe a sélectionné PagerDuty en tant que solution DevOps plus fiable et plus complète. En exploitant certaines des 700+ intégrations disponibles via PagerDuty, Groww a centralisé les alertes provenant de systèmes de surveillance tels que Plateforme Google Cloud , Prométhée , Nouvelle relique , et Grafana Groww a personnalisé PagerDuty pour s'adapter à la manière dont les services sont déployés dans l'infrastructure de l'entreprise, en clarifiant qui doit être informé d'un incident et en fournissant un contexte autour dépendances de service .

Les notifications flexibles et dynamiques de PagerDuty ont été un succès immédiat pour l'équipe, qui peut désormais recevoir des notifications par SMS, appel ou application mobile notifications push. Cela a éliminé le besoin de vérifier les e-mails et Slack en dehors des heures de travail et a considérablement amélioré le temps moyen de reconnaissance (MTTA) de l'équipe. «PagerDuty nous appelle et s'assure que nous ne manquions jamais un problème critique », a déclaré Khare.

PagerDuty permet également de faire appel à des intervenants supplémentaires lorsqu'un tri interfonctionnel est nécessaire, par exemple si les équipes de sécurité et de base de données sont affectées par l'incident. La reconnaissance, l'escalade et la résolution des incidents peuvent être effectuées au sein de l'application mobile, ce qui permet aux équipes de gérer la réponse aux incidents depuis n'importe où.

PagerDuty Règlement de l'événement Offrez à Groww la flexibilité nécessaire pour supprimer les alertes qui n'ont pas besoin de réveiller les membres de l'équipe pendant la nuit, comme les alertes de faible gravité ou non exploitables. La réduction du bruit inutile aide l'équipe à se concentrer et à répondre aux problèmes importants.

Avantages d’un processus amélioré de réponse aux incidents

PagerDuty a rapidement prouvé sa valeur chez Groww, en posant les bases d'un meilleur processus de réponse aux incidents qui alimentera la croissance de l'entreprise tout en garantissant une expérience utilisateur exceptionnelle. PagerDuty a aidé à :

  • Améliorer le MTTA. Les notifications dynamiques et les politiques d'escalade personnalisables de PagerDuty garantissent que les incidents ne sont jamais manqués.
  • Améliorer le MTTR. Les notifications parviennent plus rapidement aux bonnes personnes grâce à l'architecture basée sur les services de PagerDuty, ce qui signifie que l'intervenant peut résoudre les incidents plus rapidement.
  • Facilitez-vous la vie. La gestion des incidents mobiles et les règles d’événements ont réduit les efforts manuels et offert une flexibilité aux ingénieurs de garde.

« Si les gens n'ont pas besoin de passer du temps à déboguer et que nous pouvons éviter les temps d'arrêt, ils peuvent se concentrer sur des tâches plus importantes. Les gens seront plus satisfaits de développer de nouveaux produits plutôt que d'éteindre des incendies », a déclaré Khare.

Grandir vers l'avenir

Ayant constaté une rentabilité rapide, l'équipe DevOps est impatiente de trouver d'autres moyens d'exploiter PagerDuty pour améliorer ses opérations. Par exemple, l'équipe prévoit d'évaluer les analyses d'alertes pour mieux comprendre quels problèmes prennent le plus de temps à résoudre. Ces informations aideront à déterminer quelles améliorations du système auront le plus d'impact. En outre, l'équipe cherche à utiliser PagerDuty pour Communication avec les parties prenantes pour fournir à l’entreprise des informations sur l’ampleur de l’impact d’un incident et sur les progrès réalisés en vue de sa résolution.

Pour en savoir plus sur la manière dont PagerDuty aide les entreprises à transformer leurs opérations numériques, visitez www.pagerduty.com/customers pour plus d'informations et Commencez un essai gratuit de 14 jours aujourd'hui .