PagerDuty image

Schneller bessere Takeaways: Wie Quizlet zu einer widerstandsfähigen Engineering-Kultur übergeht und dabei seine Effizienz steigert

PagerDuty image

Größe: 201-500

Industrie: Ausbildung

Standort: San Francisco, Kalifornien

Wichtige Integrationen:

Locker
Okta
Jira

Hintergrund

Quizlet stand vor einer Herausforderung, die im Bereich Site Reliability Engineering (SRE) weit verbreitet ist: einem Vorfallmanagementprozess, der nicht dazu beitrug, die Tools oder Prozesse nach Vorfällen tatsächlich zu verbessern. Das Unternehmen suchte nach einer Lösung, die einfacher zu verwenden ist, Informationen rationalisiert, robuste Lernfunktionen bietet und die Reaktion auf Vorfälle effizienter macht. Quizlet wollte seine Kultur rund um Vorfälle zu einer Kultur verändern, die einen tieferen und kollaborativeren Ansatz zum Verständnis von Vorfällen verfolgt – eine Kultur, die Lernmöglichkeiten und Gruppendiskussionen priorisiert, um die Tools, Systeme und Prozesse kontinuierlich zu verbessern.

Vor Jeli

Vor der Einführung von Jeli verwendete Quizlet die Methoden Root Cause Analysis und 5 Why, die als veraltete Lösung für das heutige Verständnis von Vorfällen erkannt wurden. Ihr Berichtsprozess nach Vorfällen umfasste zwei Optionen, darunter einen traditionellen und einen einfachen Bericht nach Vorfällen; bei letzterem blieben die Erkenntnisse auf der Strecke. Ihre Vorlage für den Bericht nach Vorfällen in Google Docs war für Einsatzleiter (ICs) eine Reibungsquelle. Einige ICs fanden den Zeitleistenabschnitt des Berichts nach Vorfällen schwierig zu lesen und zu verstehen, da es keine visuelle Darstellung der Dauer oder der relativen Auswirkungen gab. Das Team stellte fest, dass das Erstellen einer Zeitleiste ein zeitaufwändiger, manueller Prozess war, bei dem unzählige Nachrichten und Zeitstempel in das Google Doc kopiert und eingefügt werden mussten. Darüber hinaus suchte die Organisation auch nach einer Lösung, um ihre Einsatzkräfte bei Vorfällen besser zu unterstützen, die Reaktion auf Vorfälle zu automatisieren und ihre Arbeitsabläufe zu optimieren.

Eine Lösung finden

Quizlet wollte eine Lösung, die die mühsamen Aufgaben der Koordination und Kommunikation während eines Vorfalls rationalisiert und gleichzeitig die Erfassung der Daten erleichtert, die zum Verständnis des Vorfalls im Nachhinein erforderlich sind. Jeli arbeitete bei der Entwicklung des Jeli Incident Response (IR) Bot mit Quizlet zusammen, um wichtige Funktionen zu entwickeln, die die Anforderungen von Quizlet erfüllen:

  • Broadcast-Kanäle zur Automatisierung der Updates an relevante Slack-Kanäle ihrer Wahl. So wird die kanalübergreifende Kommunikation verbessert und gleichzeitig die kognitive Belastung der antwortenden Ingenieure verringert.
  • Importieren Sie Ereignisdaten und Slack-Nachrichten automatisch in die Jeli-Plattform, nachdem ein Vorfall abgeschlossen wurde.
  • Erstellen Sie während eines Vorfalls ganz einfach Jira-Tickets mit der Jira-Integration für Jeli, um zusätzliche Schritte und kognitive Belastung während Vorfällen zu vermeiden.

„Ich liebe die Automatisierung der Arbeit, die Jeli bietet.“

– Yanet L. , Platform Engineering Manager, Quizlet

Die Ergebnisse: Bessere Erkenntnisse, schneller

Quizlet hält jetzt alle zwei Wochen Learning From Incidents (LFI)-Meetings ab, um den Austausch von Erkenntnissen zu verbessern. Während des Meetings konzentriert sich das Team darauf, die Teilnehmer zu fragen, was ihr Denkprozess in diesem Moment war und welche Themen dem Team aufgefallen sind. Dies ermöglicht eine kollaborative Erfahrung, die dabei hilft, die wichtigsten Erkenntnisse aus dem Vorfall zu gewinnen. Das LFI-Meeting hilft dem Quizlet-Team auch dabei, Lücken in der Werkzeugausstattung zu erkennen, herauszufinden, wie die Leute arbeiten und ob zusätzliche Teamschulungen für wichtige Tools erforderlich sind. Mit der Einführung von Jeli hat Quizlet die Effizienz der Arbeitsabläufe gesteigert und die Belastbarkeit erhöht:

  • Ingenieure können sich auf die Reaktion auf einen Vorfall konzentrieren, während andere notwendige angrenzende Teile eines Vorfalls automatisiert werden, um die kognitive Belastung zu verringern. Ingenieure erstellen in kürzerer Zeit qualitativ hochwertige Aktionselemente.
  • Die Entwicklungsabteilung hat die Anzahl der analysierten Vorfälle erhöht, um tiefere Einblicke und Erkenntnisse über ihre Systeme und Tools zu gewinnen und so kontinuierliche Verbesserungen voranzutreiben.
  • Google Docs und alte Prozesse wurden durch eine Plattform ersetzt und automatisiert, die für die Überprüfung von Vorfällen entwickelt wurde, um alle wichtigen Details effizient zu erfassen.

Zusammenfassung

Das Quizlet-Team erstellt jetzt mit Jeli häufiger und mit weniger Aufwand Berichte nach Vorfällen. Mit dem Jeli Narrative Builder werden Zeitleisten schneller und mit mehr wichtigen Details erstellt. Die umfassenderen Zeitleisten enthalten jetzt den Kontext, um zu verstehen, was während des Vorfalls passiert ist, wer daran beteiligt war, und die erforderliche visuelle Darstellung, um wichtige Erkenntnisse und Verbesserungsbereiche zu identifizieren. Die Jeli-Plattform für Vorfallreaktion und -management hat es Quizlet ermöglicht, sein Vorfallmanagement zu einem modernen, ausgefeilteren Ansatz mit optimierten, vorhersehbaren Arbeitsabläufen voranzutreiben.