PagerDuty image

Groww entscheidet sich für PagerDuty für ein besseres DevOps-Erlebnis

PagerDuty image

Größe: 1.001 – 5.000 Mitarbeiter

Industrie: Finanzdienstleistungen

Standort: Bangalore, Indien

Kunde seit: 2022

Wichtige Integrationen:

Google Cloud Platform
Prometheus
Neues Relikt
Grafana

Gegründet im Jahr 2017, Wachsen ist eine Anlageplattform, die es Benutzern ermöglicht, einfach, papierlos und unkompliziert in Aktien, Investmentfonds, ETFs und Gold zu investieren. Das FinTech ist eine der am schnellsten wachsenden Anlageplattformen Indiens und hat Unicorn-Status erreicht, indem es das Investieren für neue Anleger einfach und transparent macht.

Betrieben unter einer Diensteigentum Modell ist das DevOps-Team für mehrere unternehmenskritische Dienste verantwortlich, darunter Authentifizierungs- und Zahlungsdienste. Das Team muss auch sicherstellen, dass Kunden Marktdaten in Echtzeit anzeigen und Bestellungen aufgeben können. Im vergangenen Jahr erreichte das Startup über 30 Millionen Benutzer und erhöhte seine technische Belegschaft um über 65 %, um das schnelle Wachstum zu unterstützen.

Aman Khare, DevOps Engineer, unterstützt die Infrastruktur und Sicherheit der Plattform. „Wir sorgen dafür, dass die Infrastruktur läuft. Wir sorgen dafür, dass unsere Kunden auf unserer Plattform das bestmögliche Erlebnis haben“, sagte er.

DevOps nach Feierabend

Groww hatte eine Lösung für das Bereitschaftsmanagement im Einsatz, die jedoch bei Vorfällen nicht immer zuverlässig war, insbesondere außerhalb der normalen Geschäftszeiten. DevOps-Ingenieure verpassten manchmal mitten in der Nacht E-Mail- und Slack-Benachrichtigungen. „Wir konnten uns bei Benachrichtigungen spät in der Nacht nicht auf Slack verlassen, und die Zeit bis zur Bestätigung war ziemlich lang“, erzählte Khare.

Die Einbeziehung anderer Helfer oder Fachexperten bei kritischen Vorfällen erforderte manuelle Arbeit für das Team. Noch frustrierender war, dass es passieren konnte, dass ein ganzes Team eine Warnung erhielt, über die der diensthabende Techniker keine E-Mail erhalten hatte. In solchen Situationen musste man die richtigen Personen ausfindig machen, was die Lösungszeit verlängerte.

Darüber hinaus hatte das Team keine Möglichkeit, Warnmeldungen aufgrund bestimmter Bedingungen wie etwa der Schwere zu unterdrücken. Einige Warnmeldungen waren nach Feierabend nicht mehr relevant und konnten bis zum nächsten Tag bearbeitet werden. Zu viel Lärm machte es den Ingenieuren schwer, sich auf das Wesentliche zu konzentrieren.

Diese Herausforderungen machten die Bereitschaft des DevOps-Teams zu einer schwierigen Angelegenheit. Es wurde klar, dass das Team einen besseren Vorfallreaktionsprozess benötigte, der mit dem Unternehmen skalierbar war. „Wir brauchten etwas, das die Erfahrung unserer Entwickler verbessern konnte“, erklärte Khare.

Ein zuverlässiges Werkzeug für zuverlässige Ergebnisse

Nach der Prüfung alternativer Optionen entschied sich das Team für PagerDuty als zuverlässigere und umfassendere DevOps-Lösung. Durch die Nutzung einiger der über 700 Integrationen, die über PagerDuty verfügbar sind, zentralisierte Groww Warnmeldungen von Überwachungssystemen wie Google Cloud Platform , Prometheus , Neues Relikt , Und Grafana . Groww hat PagerDuty angepasst, um es an die Art und Weise anzupassen, wie Dienste in der Infrastruktur des Unternehmens bereitgestellt werden. Dies schafft Klarheit darüber, wer über einen Vorfall benachrichtigt werden sollte, und bietet Kontext zu Dienstabhängigkeiten .

Die flexiblen, dynamischen Benachrichtigungen von PagerDuty waren ein sofortiger Gewinn für das Team, das nun Benachrichtigungen per SMS, Anruf oder Mobile App Push-Benachrichtigungen. Dadurch entfällt die Notwendigkeit, nach Feierabend E-Mails und Slack zu überprüfen, und die mittlere Zeit bis zur Bestätigung (MTTA) des Teams wird erheblich verkürzt. „PagerDuty ruft uns an und stellt sicher, dass wir nie ein kritisches Problem verpassen“, sagte Khare.

PagerDuty erleichtert außerdem die Einbeziehung zusätzlicher Helfer, wenn eine abteilungsübergreifende Sichtung erforderlich ist – beispielsweise, wenn die Sicherheits- und Datenbankteams von dem Vorfall betroffen sind. Das Bestätigen, Eskalieren und Lösen von Vorfällen kann alles innerhalb der mobilen App erfolgen, sodass Teams die Reaktion auf Vorfälle von überall aus verwalten können.

PagerDuty Veranstaltungsregeln Geben Sie Groww die Flexibilität, Warnungen zu unterdrücken, die Teammitglieder nicht über Nacht wecken müssen, wie z. B. Warnungen mit geringer Schwere oder nicht umsetzbare Warnungen. Die Reduzierung unnötigen Lärms hilft dem Team, sich zu konzentrieren und auf wichtige Probleme zu reagieren.

Vorteile eines verbesserten Incident-Response-Prozesses

PagerDuty hat sich bei Groww schnell bewährt und den Grundstein für einen besseren Incident-Response-Prozess gelegt, der das Wachstum des Unternehmens vorantreibt und gleichzeitig für ein großartiges Benutzererlebnis sorgt. PagerDuty hat geholfen:

  • MTTA verbessern. Die dynamischen Benachrichtigungen und anpassbaren Eskalationsrichtlinien von PagerDuty stellen sicher, dass kein Vorfall übersehen wird.
  • MTTR verbessern. Dank der servicebasierten Architektur von PagerDuty erreichen Benachrichtigungen die richtigen Personen schneller, sodass der Helfer Vorfälle schneller lösen kann.
  • Machen Sie das Leben leichter. Durch mobiles Vorfallmanagement und Ereignisregeln wurde der manuelle Aufwand verringert und den diensthabenden Technikern mehr Flexibilität geboten.

„Wenn die Leute keine Zeit mit der Fehlerbehebung verbringen müssen und wir Ausfallzeiten vermeiden können, können sie sich auf wichtigere Aufgaben konzentrieren. Die Leute werden zufriedener sein, wenn sie neue Produkte entwickeln, anstatt Probleme zu lösen“, sagte Khare.

In die Zukunft wachsen

Nachdem sich die Amortisierungszeit verkürzt hat, möchte das DevOps-Team weitere Möglichkeiten finden, PagerDuty zur Verbesserung seiner Betriebsabläufe zu nutzen. So plant das Team beispielsweise, Warnanalysen auszuwerten, um besser zu verstehen, welche Probleme am längsten dauern. Diese Informationen helfen dabei, zu bestimmen, welche Systemverbesserungen die größte Wirkung haben werden. Außerdem möchte das Team PagerDuty nutzen für Stakeholder-Kommunikation um dem Unternehmen Informationen über das Ausmaß der Auswirkungen eines Vorfalls und den Fortschritt bei seiner Lösung zu liefern.

Weitere Informationen dazu, wie PagerDuty Unternehmen bei der Transformation ihrer digitalen Abläufe unterstützt, finden Sie unter www.pagerduty.com/customers für weitere Informationen und Starten Sie noch heute eine 14-tägige kostenlose Testversion .