SendGrid steigert die Mitarbeiterproduktivität und reduziert Ausfallzeiten mit PagerDuty
Größe: 331 Mitarbeiter
Industrie: Informationstechnologie und Dienstleistungen
Standort: Boulder, Colorado (Bundesstaat)
Kunde seit: 2016
SendGrid ist eine bewährte cloudbasierte Kundenkommunikationsplattform, die jeden Monat erfolgreich über 25 Milliarden E-Mails an Internet- und Mobilfunkkunden versendet. Das Unternehmen hat seinen Hauptsitz in Colorado und beschäftigt über 300 Mitarbeiter, davon 23 im Betriebsteam und etwa 84 in der Entwicklungsgruppe. Mary Moore-Simmons, Engineering Operations Manager, ist für die Verwaltung der Infrastruktur bei SendGrid verantwortlich, zu der Server und Rechenzentren, das dahinter stehende Netzwerk, Virtualisierungsstapel und Backend-Systeme gehören. Aufgrund der hohen Anzahl von E-Mails, die von SendGrid gesendet werden, werden täglich zahlreiche Vorfallwarnungen generiert. Die Suche nach einer skalierbaren, unternehmenstauglichen Lösung zur Rationalisierung und Vereinfachung des manuellen Vorfallwarnungsprozesses war eine der wichtigsten Initiativen des Unternehmens.
Ersetzen des bisherigen Warntools und Überwinden von Skalierbarkeitsproblemen
SendGrid erhält an einem typischen Tag bis zu zweitausend Vorfallmeldungen und bei technischen Vorfällen oder Ausfällen Zehntausende pro Minute. Angesichts einer so großen Menge ist es für das Unternehmen wichtig, schnell und effizient auf die Meldungen zu reagieren. Vor der Umstellung auf PagerDuty nutzte SendGrid einen anderen Anbieter zur Meldung, erkannte jedoch, dass es eine umfassende Vorfallmanagementlösung benötigte, um die hohe Anzahl an Vorfällen zu bewältigen. „Wenn man ein Tool im Einsatz hat, möchte man, dass es funktioniert, insbesondere bei einem Ausfall; dann erwartet man, dass es funktioniert“, so Moore-Simmons. Angesichts der Skalierbarkeitsprobleme entschied sich SendGrid für die Umstellung auf eine zuverlässige und skalierbare Vorfallmanagementlösung.
„PagerDuty hilft uns, schneller auf die Warnmeldungen zu reagieren, die wir erhalten. Wir können Ausfälle schneller diagnostizieren, was wiederum das Erlebnis unserer Kunden verbessert und Ausfallzeiten sowie die damit verbundenen Kosten reduziert.“
– Mary Moore-Simmons, Engineering Operations Manager, Sendgrid
Beschleunigen Sie MTTA und MTTR durch die Umstellung auf eine neue Vorfallmanagementplattform
SendGrid hat PagerDuty als neue Vorfallmanagementlösung implementiert und nutzt die Plattform für Zusammenarbeit, Planung, Eskalation und Berichterstattung. Während der Bereitschaft kann ein Benutzer einen Vorfallalarm bestätigen, den Alarm bei Bedarf eskalieren oder das vorliegende Problem lösen, sodass er ohne Verzögerung direkt zum nächsten Vorfall übergehen kann. Das Haupt-Dashboard, das alle Vorfälle meldet, ist ein weiterer entscheidender Vorteil für SendGrid. „Die Benutzeroberfläche des Vorfallmanagement-Dashboards von PagerDuty ist so gestaltet, dass Sie sehen können, was los ist und welche Art von Alarmen Sie erhalten. Das ist für uns sehr hilfreich – wir müssen uns nicht mehr ständig um eine Liste von Alarmen kümmern und verlieren den Überblick darüber“, sagte Moore-Simmons.
Moore-Simmons hält die Berichtsfunktion von PagerDuty für das wichtigste Kapital in ihrer Rolle. Durch die Berichterstattung über Kennzahlen erhält sie Einblicke in die Anzahl der Alarme pro Tag, pro Woche, pro Monat und pro Jahr. „Wir hatten dieses Jahr schätzungsweise 78.000 Alarme und das Ziel des Unternehmens war, die Anzahl der Alarme im Vergleich zu 2015 um 50 % zu reduzieren. Bislang liegen wir mit dieser Kennzahl im Plan, dank der Unterstützung von PagerDuty“, erklärte Moore-Simmons. Sie konnte auch herausfinden, dass die durchschnittliche mittlere Reparaturzeit (MTTR) des Teams 19 Minuten beträgt, während die durchschnittliche mittlere Bestätigungszeit (MTTA) nur 2 Minuten beträgt. Das Sammeln dieser Art von Informationen hilft sowohl Moore-Simmons als auch den anderen technischen Leitern, herauszufinden, was funktioniert, was nicht und wie das Problem behoben werden kann.
Der größte Vorteil für SendGrid war, dass die Betriebs- und Entwicklungsteams dank der zuverlässigen und schnellen Vorfallbenachrichtigungen Ausfälle nun schnell beheben und ein erneutes Auftreten verhindern konnten. Jede Minute, in der ein Ausfall auftritt, kostet das Unternehmen Tausende von Dollar und führt zu einem schlechten Kundenerlebnis und Kundenabwanderung. Durch weniger Ausfälle gab es weniger Kundenabwanderung. Darüber hinaus ist das Team nach der Umstellung auf PagerDuty nun zufriedener und produktiver.
„Wir vertrauen auf PagerDuty und müssen uns keine Sorgen mehr über unnötig lange Ausfälle und Umsatzeinbußen machen.“
– Mary Moore-Simmons, Engineering Operations Manager, Sendgrid
Steigerung der Mitarbeiterproduktivität und Verbesserung der Skalierbarkeit
SendGrid kann sich auf PagerDuty als zuverlässige Lösung verlassen, um seine Anwendungsfälle, kritischen Alarme und Zeitplanung zu unterstützen. „Wir vertrauen auf PagerDuty und müssen uns keine Sorgen mehr über unnötig lange Ausfälle und Umsatzverluste machen. Jeder, der bei SendGrid Bereitschaftsdienst hat, verwendet PagerDuty und kennt die Lösung als etablierten Anbieter“, sagte Moore-Simmons. Die Mitarbeiter sind zufrieden und produktiv, was für das Unternehmen wichtig ist. Insgesamt hat das Unternehmen nach der Umstellung auf PagerDuty viele Vorteile festgestellt, darunter schnellere Lösungszeiten bei Ausfällen, eine höhere Produktivität und Zufriedenheit der Mitarbeiter sowie beeindruckende Kennzahlen, die die betriebliche Effizienz des Unternehmens belegen.