Brightcove : fournir des solutions vidéo fiables avec PagerDuty

PagerDuty image

Taille: 250+

Industrie: Technologie

Emplacement: Boston, Massachusetts

Client depuis : 2/2010

Brightcove est un fournisseur mondial de premier plan de services cloud pour la vidéo. La société propose des produits qui révolutionnent la manière dont les entreprises proposent des expériences vidéo, notamment Video Cloud, la plateforme vidéo en ligne leader du marché et Zencoder, un fournisseur leader de services de traitement multimédia basés sur le cloud et de technologie de lecteur vidéo HTML5. Brightcove compte plus de 6 300 clients dans plus de 70 pays qui s'appuient sur les services de contenu cloud Brightcove pour créer et exploiter des expériences vidéo sur PC, smartphones, tablettes et téléviseurs connectés.

Les premiers défis de Brightcove

Il y a trois ans, Brightcove a adopté un modèle DevOps pour donner à ses ingénieurs la responsabilité des phases de conception, de production et de support de leur code. L'objectif de DevOps est de créer plus rapidement des logiciels de haute qualité, mais la plupart des transitions DevOps échouent en raison d'un manque de changement culturel et technologique pour soutenir cette transition. Brightcove a fait le premier pas culturel vers ce modèle en étendant le service d'astreinte aux développeurs. Il était logique que les personnes qui créaient le code soient celles qui résolvent les problèmes lorsqu'ils se produisent. La forte culture d'équipe de Brightcove permettait aux employés de choisir leurs propres rotations d'astreinte. Ces plannings étaient difficiles à gérer car de nouveaux membres de l'équipe étaient ajoutés et des changements fréquents étaient nécessaires. De plus, ces plannings ne résolvaient pas le problème de la gestion du cycle de vie des incidents. Il n'était pas clair qui travaillait sur un incident et à quelle étape il se trouvait. Cela entraînait une remontée prématurée des problèmes vers d'autres coéquipiers ou responsables.

« Nous manquions de visibilité sur la responsabilité des incidents, ce qui a eu un impact sur notre efficacité. » – Brian Sensale, responsable ingénieur senior

Tous les ingénieurs d'astreinte recevaient des alertes via des BlackBerry synchronisés avec leurs outils de surveillance. Les BlackBerry étaient utilisés en rotation par les membres de l'équipe, mais cette approche était fastidieuse, sujette aux erreurs et limitait la participation des personnes hors de portée. Il n'y avait également aucun moyen de faire remonter les problèmes à un autre membre de l'équipe en cas d'oubli. À mesure que leurs équipes s'étendaient sur trois bureaux dans le monde, ils devaient trouver un moyen de partager équitablement les responsabilités d'astreinte.

« Nous avions besoin d’une solution adaptée à notre environnement de travail flexible. Le remplacement d’un appareil physique n’était pas une solution à grande échelle. »

Brightcove avait besoin de simplifier la logistique de la rotation des astreintes et de transférer la responsabilité de la planification directement aux ingénieurs d'astreinte. Après tout, si les ingénieurs doivent assumer les astreintes, ils doivent avoir leur mot à dire sur les horaires de travail et la manière dont ils sont avertis. Pour effectuer une transition complète vers un modèle DevOps, l'entreprise avait besoin d'une technologie qui accompagne son changement culturel.

Donner le contrôle aux ingénieurs d'astreinte

Pour les ingénieurs de Brightcove, il est important d'avoir un mode de vie équilibré. Lorsque les membres de l'équipe souhaitent partir en vacances pendant une période où ils sont censés être de garde, ils travaillent ensemble pour trouver des remplaçants. En utilisant PagerDuty pour la planification des astreintes, les changements peuvent être effectués sans problème.

« Après avoir discuté des tâches d'astreinte, il est très facile de mettre à jour les plannings dans PagerDuty. »

Les alertes manquées chez Brightcove en raison d'alertes inefficaces via leurs Blackberry ne sont plus un problème grâce à PagerDuty. Les ingénieurs peuvent désormais contrôler la manière dont ils sont avertis. Certains membres de l'équipe vivent dans des endroits où la couverture cellulaire est mauvaise, ils ont donc programmé leur téléphone fixe dans leur politique d'alerte. Tous les ingénieurs d'astreinte peuvent désormais choisir les paramètres d'alerte les plus efficaces pour eux. Si l'ingénieur d'astreinte principal manque des alertes, l'ingénieur secondaire sera alerté. Avec un flux naturel d'escalade, PagerDuty agit comme un filet de sécurité pour les incidents Brightcove et garantit que tous les problèmes seront rapidement résolus.

« Je ne peux pas imaginer la vie sans PagerDuty. Disposer de plusieurs méthodes d'alerte et d'escalade est une évidence. »

Pour améliorer la visibilité des incidents, Brightcove a intégré PagerDuty à HipChat afin que tout le monde puisse suivre le cycle de vie de l'incident. Cela signifie qu'il n'y a plus de soucis pour savoir qui s'occupe d'un incident et s'il a été résolu. Et d'autres équipes peuvent intervenir pour aider si nécessaire. Les responsables ne sont plus alertés par erreur pour des problèmes de faible gravité et peuvent être rapidement contactés en cas de problème plus important.

« Avec PagerDuty, nous avons moins d’exercices d’incendie. Nous savons maintenant si un incident est traité et par qui. Cela nous soulage du stress. »

Avec PagerDuty, Brightcove dispose de la technologie nécessaire pour soutenir sa transition DevOps et fournir un service de haute qualité et hautement fiable à ses clients.