PagerDuty verschafft dem Verbrauchervergleichsportal Verivox mehr Sichtbarkeit
Größe: Mehr als 500 Mitarbeiter
Industrie: Technologie
Standort: Heidelberg, Deutschland
Kunde seit: 2018
Verivox, eine der führenden Vergleichsseiten für Versorgungsunternehmen, Mobilfunk, Versicherungen und mehr in Deutschland, bedient über acht Millionen Verbraucher, die Preise vergleichen und den Anbieter wechseln möchten. Da sich so viele Kunden darauf verlassen, dass Verivox ihnen genaue Informationen liefert, muss die Website von Verivox stabil und zuverlässig bleiben. Und da die Konkurrenz dem Unternehmen dicht auf den Fersen ist, 13 Entwicklungsteams wöchentlich neue Funktionen herausbringen und die Engineering-Teams über das ganze Land verteilt sind, benötigte das Unternehmen eine bessere Möglichkeit, seine digitalen Abläufe zu skalieren und zu automatisieren, um Ausfallzeiten zu minimieren.
In der Vergangenheit verließ sich Verivox darauf, dass sein Site Reliability Engineering (SRE)-Team Warnmeldungen manuell überprüfte und Teams über Vorfälle informierte. Die Warnprotokolle des Unternehmens lösten jedoch regelmäßig ungültige Warnmeldungen aus, was Ressourcen verbrauchte und die Transparenz der Netzwerkintegrität beeinträchtigte. Da eine Person eine ganze Woche lang nach Geschäftsschluss (einschließlich Wochenenden) in Bereitschaft war, riskierte Verivox sowohl ein Burnout der Mitarbeiter als auch, dass möglicherweise mitten in der Nacht wichtige Warnmeldungen übersehen wurden.
„Durch die Eliminierung manueller Interaktionen hat PagerDuty unseren Alarmierungsprozess einen großen Schritt nach vorne gebracht. Und wir verlieren keine Vorfälle mehr aus den Augen, die die Produktion beeinträchtigen.“
– Waldemar Spitschak, Leiter SRE, Verivox
Von manuell zu automatisiert
Waldemar Spitschak, Head of Site Reliability Engineering, meint dazu: „In erster Linie brauchten wir PagerDuty , um die Alarmierung zu automatisieren.“ Da PagerDuty über mehr als 200 Integrationen verfügt, konnte Verivox die digitale Betriebsmanagementplattform PagerDuty problemlos mit all seinen Überwachungstools – wie New Relic, Zabbix und AWS Cloudwatch – in seiner gesamten hybriden Produktionsumgebung aus Datenbanken, Cloud-Anwendungen, Windows- und Linux-Servern und mehr verbinden.
Durch die Automatisierung von PagerDuty konnte Verivox die Bereitschaftsrollen besser definieren und zuweisen. Dadurch kann das Unternehmen Probleme sofort an Personen weiterleiten, die wissen, wie sie zu beheben sind, anstatt einen Vermittler zu zwingen, zum Telefon zu greifen und jemanden aufzuspüren. Wenn das Bereitschaftsteam mehr Ressourcen zur Unterstützung benötigt, kann es ein Reaktionsspiel ausführen, um automatisch die richtigen Personen anzusprechen. „Durch die Eliminierung manueller Interaktionen hat PagerDuty unseren Warnprozess einen großen Schritt nach vorne gebracht“, kommentierte Spitschak. „Und wir verlieren nicht mehr den Überblick über Vorfälle, die die Produktion beeinträchtigen.“
„Wir reagieren auf Vorfälle schneller als je zuvor und lösen sie, was wirklich wichtig ist, da unser Entwicklungszyklus so kurz ist“, fügte er hinzu.
Die Automatisierung gleicht außerdem die Spitzen und Täler im saisonalen Arbeitsablauf von Verivox aus, indem sie den Bereitschaftsprozess standardisiert und dem Unternehmen eine bessere Kostenvorhersage ermöglicht. Mit PagerDuty bieten Bereitschaftsteams jetzt das ganze Jahr über die gleiche umfassende Abdeckung und halten so auch über die Spitzenzeit im vierten Quartal hinaus ein gleichbleibendes Maß an Fachwissen aufrecht.
Verbesserte Sichtbarkeit wirft Licht auf digitale Abläufe
Mit PagerDuty hat Verivox jetzt ein besseres Verständnis für Vorfälle – Spitschaks Team kann die genaue Anzahl der Vorfälle pro Dienst sehen und wie schnell sie behoben werden. Die Daten helfen ihnen festzustellen, ob die Plattform angemessen funktioniert oder ob ein bestimmter Dienst betroffen ist. Mit der umfangreichen API-Funktionalität von PagerDuty kann Verivox verschiedene Berichte und Warnmechanismen generieren und automatisierte Wartungsarbeiten einrichten.
„Mit PagerDuty erhalten wir einen ganzheitlicheren Überblick. Früher mussten wir Entscheidungen aus dem Bauch heraus treffen. Mit PagerDuty haben wir ein klareres Bild davon, was in unserer Produktionsumgebung vor sich geht“, so Spitschak.
Die erhöhte Transparenz hilft Verivox auch dabei, die Qualität der Überwachung und Warnmeldungen zu verbessern. Da Verivox ungültige, veraltete Warnmeldungen aus PagerDuty entfernt hat, ist die Überwachung jetzt viel besser als zuvor. Und weniger Warnmeldungen bedeuten, dass Verivox weniger Vorfälle bearbeiten muss. „Früher hat unser Warnsystem 10 bis 20 Mal mehr E-Mails verschickt, als die Bereitschaftsperson zum Reagieren benötigte“, berichtet Spitschak. „Jetzt liegt das Verhältnis eher bei 1:1.“
Ausblick
Das Unternehmen plant, PagerDuty bald in der gesamten Organisation und in den Tochtergesellschaften der Muttergesellschaft einzusetzen. „Mit PagerDuty erhalten wir einen viel klareren Überblick über den Zustand unserer Produktionsumgebung und wir untersuchen die Einsatzkommandokonsole Und Betriebliches Gesundheitsmanagement ”, sagte Spitschak.
Während Verivox sich zunächst für PagerDuty wegen seiner Warnfunktionen entschied, nutzt das Unternehmen die Lösung nun auch, um andere wichtige Aspekte seines digitalen Betriebsmanagements zu verbessern. Und da es für schnell wachsende Unternehmen wie Verivox wichtig ist, mehr für ihr Geld zu bekommen, um in einem wettbewerbsintensiven Markt die Nase vorn zu behalten, plant das Unternehmen , PagerDuty auch zur Definition und Messung wichtiger Leistungsindikatoren einzusetzen.
Besuchen www.pagerduty.com für weitere Details zur digitalen Betriebsmanagementlösung von PagerDuty oder gewinnen Sie Einblicke, Strategien und praktische Erfahrungen bei einem unserer vielen Kommende Veranstaltungen .