PagerDuty image

Ecobee verbessert die Gesundheit und Produktivität des Teams mit PagerDuty

PagerDuty image

Größe: 101 - 500 Mitarbeiter

Industrie: Technologie

Standort: Toronto, Ontario

Kunde seit: 2016

Wichtige Integrationen:

Terraform

ecobee wurde 2007 gegründet und ist ein kanadisches Unternehmen für Heimautomatisierung, das Wi-Fi-fähige Thermostate für private und gewerbliche Anwendungen herstellt, um den Benutzern zu helfen, den Komfort zu maximieren, ihren CO2-Fußabdruck zu reduzieren und Geld zu sparen. Hinter den Kulissen dieses benutzerfreundlichen Produkts verbergen sich kontinuierliche Bereitstellungen unternehmenskritischer Anwendungen und Dienste, eine regional verteilte Infrastruktur und selbstheilende Servercluster, die die Dienste für ihren weltweiten Kundenstamm warten und online halten.

Jordan Christensen, VP of Technology bei ecobee, ist für die Plattforminfrastruktur des Unternehmens verantwortlich, einschließlich Automatisierung, Selbstheilung sowie End-to-End-Servicebereitstellung und -verfügbarkeit. „Die Hauptaufgabe meines Teams besteht darin, eine zuverlässige, fehlertolerante Infrastruktur aufzubauen, und PagerDuty ist wirklich die entscheidende Plattform, mit der wir diese Zuverlässigkeit messen und überwachen“, erklärte er.

Herausforderungen

Da das Spitzenprodukt von ecobee für die Temperaturregelung in Millionen von Wohn- und Geschäftsgebäuden zuständig ist, müssen seine Dienste immer online und für Benutzer verfügbar sein. Eine kleine Störung oder ein Anwendungsfehler kann zu Umsatzeinbußen führen. Daher kommt es auf Minuten an, wenn es darum geht, potenziellen Vorfällen zuvorzukommen und darauf zu reagieren, bevor sie sich auf die Kunden auswirken.

Um seinen Benutzern das beste Kundenerlebnis zu bieten, musste ecobee das Vorfallmanagement aus einem proaktiven und präventiven Blickwinkel angehen. Zu diesem Zweck benötigten die Entwicklungsteams eine Plattform, die Echtzeittransparenz über die gesamte Infrastruktur und alle Dienste von ecobee ermöglicht.

Infrastruktur als Code mit Terraform

Jordans Plattformteam verlässt sich stark auf Terraform-Integration von PagerDuty um ihre PagerDuty Instanz als Code in die größere Infrastruktur zu integrieren. Durch die Integration von PagerDuty in Terraform können Teams den Echtzeitzustand ihrer Infrastruktur besser verstehen und vollständige Transparenz in Bereitschaftsrotationen und -pläne erlangen, da alles als Code innerhalb der Terraform-Umgebung definiert ist.

Mit dieser Technik konnten die Teams die manuelle Arbeit des Bereitschaftsmanagements einsparen und Möglichkeiten zur Automatisierung schaffen, um Bereitschaftsrotationen und -pläne zwischen verschiedenen Anwendungen und Diensten aufrechtzuerhalten. „ PagerDuty ist als Code und nicht als separate Schnittstelle in die Infrastruktur eingebettet und wird so zu einem zentralen Bestandteil der Infrastruktur, anstatt als Nebendienst herumzuhängen“, erklärte Jordan. Diese verbesserte Sichtbarkeit und die Möglichkeit, Code innerhalb der Codebasis von ecobee zu manipulieren, ermöglichen es seinen Teams, den Zustand der Infrastruktur wirklich zu verstehen, wenn unvermeidlich Vorfälle auftreten. Mithilfe dieser Integration arbeitet das ecobee-Team schrittweise auf eine 49-prozentige Verfügbarkeit in Bezug auf Betriebszeit und Verfügbarkeit hin.

Die Vorteile von PagerDuty

Mit PagerDuty kann ecobee proaktiv an Vorfällen arbeiten und sich voll und ganz auf den Kontext des jeweiligen Vorfalls konzentrieren. „Die Erkenntnisse sind gezielt und spezifisch, nicht allgemein“, erinnert sich Jordan. Durch die Zentralisierung aller Signale von jedem Container, Server, jeder Anwendung und jedem Mikrodienst in PagerDuty können seine Teams Probleme leicht diagnostizieren und automatisch die richtigen Personen einbeziehen, um das Problem zu beheben, bevor es sich auf den Kunden auswirkt.

Jordans Team konnte durch PagerDuty zahlreiche Vorteile erzielen, darunter:

  • Verbesserte Transparenz und Kommunikation zwischen Engineering-Teams und anderen wichtigen Stakeholdern während des gesamten Incident-Management-Lebenszyklus
  • Ein automatisierter Antwortprozess, der manuelle Arbeit reduziert und die Produktivität sowie die Work-Life-Balance verbessert
  • Teams, die durch die Ausübung von Rechenschaftspflicht und Full-Service-Eigentum befähigt sind, Veränderungen zum Besseren herbeizuführen
  • Die Schaffung eines sicheren Raums für Junior-Ingenieure, um Vorfälle zu eskalieren und direkt mit erfahrenen Ingenieuren zusammenzuarbeiten, wenn sie das Gefühl haben, dass sie Anleitung brauchen, was zur Verbesserung der Teamgesundheit beiträgt.

Ein starker Fokus auf die Gesundheit des Teams

Durch die Implementierung von PagerDuty in der gesamten Engineering-Organisation – zusammen mit anderen wichtigen Geschäftseinheiten und Stakeholdern – konnte die Unternehmensleitung laut Jordan einen starken Fokus auf die Gesundheit des Teams, die Work-Life-Balance und die Schaffung von Entwicklungsmöglichkeiten für Nachwuchsingenieure legen. „Mit PagerDuty fühlen sich die Mitarbeiter auf Abruf sicher, weil sie wissen, dass sie Probleme an erfahrene Entwickler weiterleiten können, die ihnen Anleitung geben und sie durch die Lösung führen“, erklärte Jordan. Kleinere Vorfälle werden oft zu Lernmöglichkeiten, was die Moral und die Teamgesundheit im Unternehmen stärkt.

„Ohne PagerDuty wäre es für uns als Unternehmen äußerst schwierig, ein angemessenes Vorfallmanagement und eine angemessene Reaktion durchzuführen.“

Jordan Christensen , Vizepräsident für Technologie

Die Zukunft von PagerDuty mit ecobee

Ecobee plant, die Nutzung und Ausweitung von PagerDuty im gesamten Unternehmen fortzusetzen. Insbesondere möchten die Entwicklungsteams lernen, PagerDuty Moderne Reaktion auf Vorfälle So können sie Reaktionsspiele für bestimmte Dienste implementieren und bestimmte Aufgaben innerhalb einer Reaktionsaktion automatisieren. Die Teams planen außerdem, die Slack-Integration von PagerDuty zu nutzen, um die Kommunikation zu zentralisieren und die Zusammenarbeit zwischen den Teams bei größeren Vorfällen zu verbessern.

Darüber hinaus möchte ecobee einen Post-Mortem-Ausbau innerhalb seiner PagerDuty Instanz formalisieren, um den gesamten Vorfalllebenszyklus auf einer Plattform zu zentralisieren. Jordans Team möchte außerdem die volle Leistungsfähigkeit der PagerDuty REST API nutzen, um die Automatisierung zu fördern und die Geschäftseffizienz im Rest der Organisation zu steigern. „Wir haben noch nicht einmal angefangen, an der Oberfläche dessen zu kratzen, was wir mit PagerDuty wirklich erreichen können“, erklärte Jordan.

Möchten Sie mehr darüber erfahren, wie PagerDuty den Gesundheits- und Vorfallmanagementprozess Ihres Teams verbessern kann? Melden Sie sich an für eine zwei Wochen kostenlos testen heute !