Der Blog

Evernote verbessert die Customer Journey mit PagerDuty

von Garrett Plasky 30. April 2018 | 3 Minuten Lesezeit

Stellen Sie sich vor, wie frustrierend es ist, wenn Sie gerade etwas in Google Docs schreiben und plötzlich die Internetverbindung verloren geht. Oder wie panisch Sie sind, wenn Sie in der Notizen-App Ihres Telefons nach einer ganz bestimmten Notiz suchen, die Sie am Computer über Elefanten in Dschibuti geschrieben haben, um das Quizspiel zu gewinnen – und sie nicht finden können.

Von Besprechungsnotizen bis hin zu kleinen Wissenshäppchen – Evernote unterstützt Menschen beim Erstellen, Sammeln, Pflegen und Teilen von Informationen. Unsere einzigartigen Suchfunktionen ermöglichen es Nutzern, Informationen jederzeit zu finden, unabhängig vom Format – ob Notiz, Bild, PDF oder Sprachaufzeichnung. Unser Produkt ist eine plattformübergreifende Software-as-a-Service-Anwendung, die es Nutzern ermöglicht, Gedanken jederzeit und von jedem Gerät aus zu organisieren, zu personalisieren, zu nutzen und zu teilen. Aktuell nutzen über 220 Millionen Menschen weltweit unser Produkt, und diese Zahl wächst täglich.

Als SRE-Manager ist mein Team von Site Reliability Engineers für die Kundenzufriedenheit verantwortlich, indem es sicherstellt, dass unser Produkt wie vorgesehen funktioniert. Das bedeutet minimale Ausfallzeiten, aber wenn Ausfallzeit passiert, müssen wir schnell handeln und das Problem so schnell wie möglich lösen.

Hier kommt PagerDuty ins Spiel: Als ich 2012 zu Evernote kam, nutzten wir PagerDuty hauptsächlich für Alarme und Benachrichtigungen, aber auch Bereitschaftsrotationsplanung . Im Jahr 2016 begannen wir mit einer umfassenden Weiterentwicklung unserer Hosting-Infrastruktur, bei der es um die Migration vieler Workloads auf die Google Cloud Platform ging. Durch Umzug in die Cloud konnten Ingenieure Dienste schneller als je zuvor iterieren und erstellen.

Mit dieser erhöhten Agilität gingen jedoch auch neue Herausforderungen einher, nämlich die Verfolgung wichtiger Leistungsindikatoren, die mit unseren Service-Level-Zielen (SLOs) verknüpft sind, die wir intern verwenden, um zu ermitteln, welche Vorfälle die negativsten Auswirkungen auf die Customer Journey haben.

Unsere Kunden legen beispielsweise Wert darauf, wie lange es dauert, eine Notiz auf ihren Geräten zu öffnen, zu schreiben und zu synchronisieren. Wenn bei einer dieser Aktionen ein Problem auftritt, muss mein Team sofort informiert werden und den Vorfall so schnell wie möglich beheben. Andererseits erhalten wir auch dann eine Benachrichtigung, wenn ein Server ausfällt und acht davon noch laufen. Wenn dies jedoch die Erfahrung unserer Kunden (und unser SLO) nicht beeinträchtigt, ist es wahrscheinlich keine große Sache und wir können planen, uns später darum zu kümmern. PagerDuty unterstützt uns dabei, indem es alle unsere Benachrichtigungen bündelt und gruppiert, sodass wir priorisieren können. So können wir die Dinge von oben nach unten und nicht von unten nach oben betrachten. Darüber hinaus bietet die Plattform Erweiterte Analyse Funktionen bieten uns eine einzige zuverlässige Quelle für die Transparenz von Produktionsproblemen.

Da wir weiter wachsen, planen wir, die Nutzung von PagerDuty innerhalb des Unternehmens auszuweiten, insbesondere im Hinblick auf die Nutzung der verfügbaren Postmortem-Vorlagen und Incident Response spielt eine weitere Automatisieren Sie unseren Incident-Response-Prozess .

Garrett Plasky ist SRE-Manager bei Evernote. Sein Team ist für den Betrieb der Produktionsservice-Infrastruktur von Evernote verantwortlich. Lesen Sie die vollständige Fallstudie, um mehr zu erfahren über Die Geschichte von Evernote .