PagerDuty image

Ecobee améliore la santé et la productivité de son équipe grâce à PagerDuty

PagerDuty image

Taille: 101 - 500 employés

Industrie: Technologie

Emplacement: Toronto (Ontario)

Client depuis : 2016

Intégrations clés :

Terraform

Fondée en 2007, ecobee est une entreprise canadienne de domotique qui fabrique des thermostats compatibles Wi-Fi pour les applications résidentielles et commerciales afin d'aider les utilisateurs à maximiser leur confort, à réduire leur empreinte carbone et à économiser de l'argent. Derrière ce produit facile à utiliser se cachent des déploiements continus d'applications et de services essentiels à la mission, une infrastructure distribuée à l'échelle régionale et des clusters de serveurs autoréparables qui fonctionnent pour maintenir et maintenir les services en ligne pour leur clientèle mondiale.

Jordan Christensen, vice-président de la technologie chez ecobee, est responsable de l'infrastructure de la plateforme de l'entreprise, notamment de l'automatisation, de l'auto-réparation et de la fourniture et de la disponibilité des services de bout en bout. « La mission globale de mon équipe est de créer une infrastructure fiable et tolérante aux pannes, et PagerDuty est vraiment la plateforme essentielle que nous utilisons pour mesurer et surveiller cette fiabilité », a-t-il expliqué.

Défis à relever

Le produit phare d'ecobee étant responsable du contrôle de la température dans des millions de bâtiments résidentiels et commerciaux, ses services doivent toujours être en ligne et disponibles pour les utilisateurs. Un petit problème ou une défaillance d'application peut entraîner une perte de revenus. Chaque minute compte donc lorsqu'il s'agit d'anticiper et de réagir aux incidents potentiels avant qu'ils n'affectent les clients.

Afin d'offrir la meilleure expérience client à ses utilisateurs, ecobee devait aborder la gestion des incidents sous un angle proactif et préventif. Pour ce faire, ses équipes d'ingénierie avaient besoin d'une plateforme qui permettrait une visibilité en temps réel sur l'ensemble de l'infrastructure et des services d'ecobee.

Infrastructure en tant que code avec Terraform

L'équipe de la plateforme Jordan s'appuie fortement sur Intégration Terraform de PagerDuty pour intégrer leur instance PagerDuty dans l'infrastructure globale en tant que code. En intégrant PagerDuty dans Terraform, les équipes peuvent mieux comprendre l'état de santé en temps réel de leur infrastructure et permettre une visibilité complète sur les rotations et les plannings d'astreinte, car tout est défini sous forme de code dans l'environnement Terraform.

Cette technique a permis aux équipes de supprimer le travail manuel de gestion des astreintes et de créer des opportunités d'automatisation en termes de maintien des rotations et des plannings d'astreinte entre les différentes applications et services. « Le fait que PagerDuty soit intégré à l'infrastructure sous forme de code plutôt que sous forme d'interface disparate en fait un élément central de l'infrastructure plutôt qu'un service auxiliaire », explique Jordan. Cette visibilité améliorée et la capacité de manipuler le code dans la base de code d'ecobee permettent à ses équipes de comprendre véritablement l'état de l'infrastructure lorsque des incidents se produisent inévitablement. Grâce à cette intégration, l'équipe d'ecobee travaille progressivement vers quatre 9 en termes de disponibilité et de temps de fonctionnement.

Les avantages de PagerDuty

Avec PagerDuty, ecobee est en mesure de travailler de manière proactive et collaborative sur les incidents et d’être pleinement opérationnel dans le contexte de l’incident en question. « Les informations sont pointues et spécifiques, pas génériques », rappelle Jordan. La centralisation de tous les signaux provenant de chaque conteneur, serveur, application et microservice dans PagerDuty permet à ses équipes de diagnostiquer facilement les problèmes et d’engager automatiquement les bonnes personnes pour résoudre le problème avant qu’il n’affecte le client.

L'équipe de Jordan a constaté plusieurs avantages grâce à PagerDuty, notamment :

  • Visibilité et communication améliorées entre les équipes d'ingénierie et les autres parties prenantes clés tout au long du cycle de vie de la gestion des incidents
  • Un processus de réponse automatisé qui réduit le travail manuel et améliore la productivité et l'équilibre entre vie professionnelle et vie privée
  • Des équipes habilitées à apporter des changements positifs grâce à la pratique de la responsabilisation et à la prise en charge complète des services
  • La création d'un espace sécurisé pour que les ingénieurs juniors puissent signaler les incidents et travailler directement avec les ingénieurs seniors lorsqu'ils estiment avoir besoin de conseils, contribuant ainsi à l'amélioration de la santé de l'équipe

Une attention particulière portée à la santé de l’équipe

Avec la mise en œuvre de PagerDuty dans toute l’organisation d’ingénierie, ainsi que dans d’autres unités commerciales et parties prenantes clés, Jordan a constaté que la direction a pu mettre l’accent sur la santé de l’équipe, l’équilibre entre vie professionnelle et vie privée et la création d’opportunités de croissance pour les ingénieurs juniors. « Avec PagerDuty, les employés se sentent en sécurité lorsqu’ils sont de garde, car ils savent qu’ils peuvent faire remonter les problèmes aux développeurs seniors pour leur fournir des conseils et les examiner afin de les résoudre », a expliqué Jordan. Les incidents mineurs se transforment souvent en opportunités d’apprentissage, ce qui renforce le moral et la santé de l’équipe au sein de l’organisation.

« Si nous n'avions pas PagerDuty, il serait extrêmement difficile pour notre entreprise de gérer et de répondre correctement aux incidents. »

Jordan Christensen , vice-président de la technologie

L'avenir de PagerDuty avec ecobee

Ecobee prévoit de poursuivre l'utilisation et l'expansion de PagerDuty dans l'ensemble de l'organisation. Plus précisément, les équipes d'ingénierie souhaitent apprendre à mieux exploiter PagerDuty Réponse moderne aux incidents afin qu'ils puissent mettre en œuvre des jeux de réponse pour des services particuliers et automatiser certaines tâches au sein d'une action de réponse. Les équipes prévoient également de tirer parti de l'intégration Slack de PagerDuty pour centraliser les communications et améliorer la collaboration entre les équipes lors d'incidents majeurs.

De plus, ecobee souhaite formaliser une version post-mortem au sein de son instance PagerDuty afin de centraliser l'ensemble du cycle de vie des incidents sur une seule plateforme. L'équipe de Jordan cherche également à exploiter toute la capacité de l'API REST PagerDuty pour encourager l'automatisation et renforcer l'efficacité commerciale dans le reste de l'organisation. « Nous n'avons même pas commencé à effleurer la surface de ce que nous pouvons réellement accomplir avec PagerDuty», a expliqué Jordan.

Vous souhaitez en savoir plus sur la manière dont PagerDuty peut améliorer le processus de gestion de la santé et des incidents de votre équipe ? Inscrivez-vous à un essai gratuit de deux semaines aujourd'hui !