Bulletproof permet la migration des clients vers le cloud avec PagerDuty

PagerDuty image

Taille: 120+ employés

Industrie: Services informatiques

Emplacement: Sydney, Australie

Client depuis : 2012

Intégrations clés :

Moniteur réseau PRTG
AWS CloudWatch
Nagios
HipChat
SumoLogic
Nouvelle relique
ServiceNow

Bulletproof, un fournisseur majeur de services de gestion et de conseil dans le cloud en Australie, est une entreprise dont le nom et la devise « Mission Critical Cloud » proclament un engagement envers la fiabilité. Pour honorer cet engagement envers plus de 700 clients de Bulletproof, il faut gérer soigneusement l'infrastructure et les services qui alimentent les opérations de l'entreprise. Il y a quelques années, après avoir eu du mal à gérer les incidents à l'aide de processus ad hoc et de technologies héritées, Bulletproof a adopté PagerDuty, ce qui a permis une amélioration révolutionnaire de sa capacité à maintenir les temps de réponse des SLA et à éviter les interruptions de service critiques. Cela a permis d'accroître la satisfaction des clients en faisant respecter les droits. Par exemple, lorsqu'un service client a le droit d'être corrigé régulièrement mais que la date du dernier correctif est dépassée, son automatisation utilise PagerDuty pour affecter un ingénieur à la résolution du problème.

Défis : Alertes inefficaces et manque d'automatisation

Les ingénieurs de Bulletproof gèrent une infrastructure cloud répartie sur plusieurs continents. Elle comprend à la fois l'infrastructure interne de l'entreprise et les environnements cloud des clients qu'ils soutiennent sur le long terme. Ces clients sont répartis dans un ensemble diversifié de secteurs, notamment le gouvernement, la finance, la fabrication et vente au détail Maintenir un service ininterrompu pour une si grande répartition d’applications critiques dans plusieurs environnements cloud n’est pas une mince affaire.

Au départ, l'équipe d'assistance de Bulletproof s'appuyait sur un système de notification primitif utilisant des téléavertisseurs physiques pour envoyer des alertes à ses ingénieurs lorsque des incidents se produisaient. Les alertes étaient envoyées par une société tierce qui transmettait les notifications aux téléavertisseurs, que les ingénieurs devaient littéralement transporter et vérifier régulièrement à tout moment. Le recours à une société de messagerie tierce ajoutait des coûts, de la latence et de l'inefficacité au système d'alerte, qui n'offrait aucun support pour les incidents. intégrations avec d'autres outils comme les plateformes de chat ou l'automatisation de tâches fastidieuses telles que la planification des astreintes. Ces processus étaient alors exécutés manuellement, souvent de manière ponctuelle.

Améliorer le bonheur et le temps de réponse des ingénieurs avec PagerDuty

Il y a cinq ans, Bulletproof a mis hors service son système d'alerte par téléavertisseur physique au profit de PagerDuty et a constaté des résultats immédiats.

L'un des avantages majeurs de PagerDuty réside dans les fonctions d'automatisation de la planification, qui permettent de « savoir clairement si quelqu'un est à la tâche et dans les délais », a déclaré Greg Cockburn, responsable du cloud chez Bulletproof. Cette visibilité de la planification a permis un meilleur équilibre entre vie privée et vie professionnelle pour le personnel de Bulletproof, car elle a permis d'identifier facilement les ingénieurs d'astreinte lors d'un incident et d'éviter de perturber les employés en congé. « Un meilleur système d'astreinte a considérablement amélioré le bonheur de notre équipe, et PagerDuty a joué un rôle important dans cette histoire », a déclaré Greg. Il a également noté que PagerDuty permet d'automatiser l'escalade des incidents et les transferts entre les ingénieurs, améliorant ainsi encore l'efficacité des flux de travail et réduisant la quantité de coordination manuelle requise de la part des ingénieurs.

« Nous utilisons PagerDuty depuis cinq ans. Nous avons eu des dizaines de milliers d'incidents. Nous n'avons jamais rencontré de problème avec le service PagerDuty . Il a toujours fonctionné ! »

– Greg Cockburn , Responsable du Cloud, Bulletproof

Grâce à PagerDuty, Bulletproof a également considérablement amélioré son temps de réponse lors du traitement des incidents, un avantage essentiel pour une entreprise dont la capacité à maintenir les accords de service avec ses clients est un élément crucial de sa valeur. « L’un de nos principaux objectifs SLA envers nos clients est le temps de réponse humaine. PagerDuty est la base qui nous permet de le fournir », a déclaré Greg.

Plus important encore, PagerDuty a fourni une solution à toute épreuve solution de gestion des incidents pour les ingénieurs de Bulletproof. Comme l'explique Greg, « nous utilisons PagerDuty depuis cinq ans. Nous avons eu des dizaines de milliers d'incidents. Nous n'avons jamais rencontré de problème avec le service PagerDuty . Il a toujours fonctionné. »

Bulletproof exploite déjà une gamme de fonctionnalités de PagerDuty , de regroupement d'alertes automatisé aux rapports SLA, à la ChatOps intégration avec HipChat . À l'avenir, cependant, avec des offres telles que DevOps Support, l'entreprise prévoit de tirer encore plus parti des fonctionnalités offertes par PagerDuty . «PagerDuty est une plateforme de nouvelle génération, avec des fonctionnalités en constante évolution dont nous ignorions même l'existence », explique Greg.