Blog

L'espace simplifié : comment PagerDuty a permis à Loft Orbital de réussir son décollage en matière de réponse aux incidents

par PagerDuty 7 décembre 2021 | 6 minutes de lecture

La prochaine grande course à l'espace est lancée. Aujourd'hui, de nombreuses entreprises se disputent leur part du marché spatial mondial, qui devrait valoir plus de 1 000 milliards de dollars d'ici 2040. Cependant, le lancement d'un satellite dans l'espace n'est toujours pas une option pour la plupart des organisations en raison des coûts prohibitifs et de la complexité de l'ingénierie requise. Aujourd'hui, grâce à une entreprise innovante de satellites en tant que service Loft orbital , n'importe quelle organisation peut acheter un billet sur un satellite partagé et lancer une technologie de capture de données dans l'espace pour une fraction du coût de cette opération.

Lancé en 2017, le modèle commercial de Loft Orbital, basé sur le satellite en tant que service, bouleverse l'industrie spatiale. Loft Orbital fait voler les charges utiles de ses clients à bord de lancements de satellites réguliers et gère l'ensemble de la mission en tant que service. Par exemple, supposons qu'un client souhaite envoyer une caméra dans l'espace pour analyser la météo. Loft Orbital ajouterait la caméra à l'un de ses prochains lancements de satellites et se chargerait du processus de collecte de données une fois la caméra dans l'espace en fonction des demandes des clients.

Comprendre la gravité de la situation

John Murray est un membre senior de l'équipe d'ingénierie logicielle et d'exploitation des satellites de Loft Orbital. Il participe à la création et à la gestion du logiciel de contrôle au sol exclusif de l'entreprise, Cockpit, une solution tout-en-un pour les opérations des satellites. Les ingénieurs contrôlent tout via Cockpit, de la planification des missions aux communications entre les satellites et les stations au sol. Cockpit est hautement automatisé, ce qui réduit le risque d'erreur humaine tout en simplifiant les opérations pour les ingénieurs de Loft Orbital et les demandes des clients.

L'une des premières tâches de Murray, lors de son embauche, a été de mettre en place un système de réponse aux incidents capable de fournir une assistance 24 heures sur 24 et 7 jours sur 7, en prévision du lancement de leur premier satellite. Le système devait évoluer en fonction de la croissance rapide de l'entreprise et s'intégrer à la pile technologique existante de Loft Orbital, comme Grafana. Loft Orbital avait besoin d'une solution avec une API stable et facile à personnaliser.

La capacité à réagir rapidement aux incidents était une priorité absolue. Loft Orbital exploite des satellites en orbite basse sur une orbite héliosynchrone, de sorte que les satellites passent régulièrement au-dessus de stations terrestres, ou de très grandes antennes paraboliques utilisées pour communiquer avec les satellites, situées aux pôles Nord et Sud. Il n'y a pas de stations terrestres dans une grande partie de l'océan Pacifique, de sorte qu'il arrive que les satellites de Loft Orbital ne soient pas en contact avec le sol. Cela signifie que si un ingénieur rate une occasion de corriger un problème, il ne pourra pas intervenir avant au moins 45 minutes. « L'urgence est essentielle car les choses ont tendance à s'aggraver très rapidement dans l'espace », explique Murray. « Les réponses rapides nous permettent d'économiser du temps et de l'argent à grande échelle. »

Une autre exigence était de repenser le centre de commandement de la mission. « Traditionnellement, une équipe de 20 personnes ou plus se trouve dans une pièce 24 heures sur 24 et 7 jours sur 7 pour maintenir le satellite en bon état et opérationnel. Nous espérons être appelés uniquement en cas de problème à résoudre, même si nous avons généralement au moins une personne en service pour effectuer certaines tâches manuelles et de maintenance », a expliqué Murray. « L’automatisation est fondamentale : nous devons pouvoir étendre nos opérations à 5, 10 ou 100 satellites rapidement sans avoir à augmenter le personnel. »

Murray avait déjà utilisé PagerDuty dans une autre entreprise et connaissait bien ses fonctionnalités. « Nous n’avions aucun doute sur le fait que PagerDuty était la meilleure solution pour résoudre nos problèmes. »

Une solution fiable

Loft Orbital a pu mettre en œuvre PagerDuty rapidement et l'intégrer de manière transparente à Cockpit et Grafana. Grafana détermine qu'il y a des problèmes de télémétrie avec un satellite tels que des températures anormales ou une faible tension de batterie, il déclenche une alerte dans PagerDuty et les ingénieurs sont en mesure de réagir rapidement. De plus, API agile de PagerDuty a pu s'intégrer facilement à Cockpit pour alerter lorsque des problèmes de performances surviennent avec le logiciel lui-même. « Depuis l'adoption de PagerDuty, l'équipe a reconnu et résolu tous les incidents rapidement, ce qui nous donne une confiance totale dans nos processus de réponse aux incidents », a expliqué Murray.

Loft Orbital bénéficie également de la simplicité de PagerDuty. L'interface de PagerDuty est si facile à utiliser que les nouveaux employés peuvent prendre en charge les opérations satellites en quelques heures seulement. «PagerDuty est un outil que je peux proposer aux utilisateurs sans avoir à me soucier d'une formation approfondie sur la manière de m'assurer qu'ils sont au courant des problèmes afin qu'ils puissent se concentrer sur la formation à la résolution des problèmes », explique Murray. « Le logiciel est suffisamment simple pour que vous le donniez aux nouveaux employés et qu'ils soient prêts à se lancer dans la course une heure plus tard. » De plus, les employés peuvent personnaliser les alertes en fonction de leurs préférences pour s'assurer qu'elles les avertissent aussi efficacement que possible, ce qui est idéal pour gérer une équipe mondiale avec des approches différentes de l'équilibre entre vie professionnelle et vie privée.

PagerDuty a amélioré la collaboration entre les équipes de Loft Orbital. L'entreprise ne suit pas une hiérarchie traditionnelle, mais permet aux ingénieurs de gérer les services et les incidents lorsqu'ils surviennent tout en garantissant la sensibilisation de l'ensemble de l'équipe en suivant les problèmes et les résolutions. En cas de problème, PagerDuty alerte l'expert concerné conformément aux politiques d'escalade définies en fonction des fuseaux horaires, minimisant ainsi les interruptions et les temps d'arrêt en dehors des heures de travail tout en documentant le problème pour référence ultérieure. «PagerDuty a considérablement simplifié la vie de notre équipe », a expliqué Murray. « Auparavant, les ingénieurs étaient coincés dans une position où ils ne savaient pas qui était l'expert en la matière, mais PagerDuty a contribué à éliminer ce problème et permet désormais une collaboration transparente. »

«PagerDuty est le ciment qui relie la surveillance humaine à la réponse automatisée et nous a donné la possibilité d'étendre rapidement nos opérations », a déclaré Murray. « Avec PagerDuty, je peux quitter mon bureau et vivre ma vie en sachant que mon équipe a accès à moi en cas d'urgence, et j'ai un moyen de revenir sur les problèmes que d'autres ont résolus. »

Mission accomplie : une culture de réponse rapide aux incidents

PagerDuty a permis à Loft Orbital de faire évoluer rapidement ses opérations et de fournir un support 24h/24 et 7j/7 à ses satellites sans centre de commandement traditionnel ni besoin d'embaucher du personnel supplémentaire au rythme de croissance de sa constellation. L'entreprise peut respecter en toute confiance tous les accords de niveau de service des clients et leur permettre de se concentrer sur ce qui compte pour eux leurs données ou services.

Loft Orbital prévoit de déployer PagerDuty auprès de différentes équipes d'ingénierie. En ajoutant davantage d'utilisateurs à la plateforme, les équipes pourront créer une structure plus solide d'orchestration des réponses et de suivi et de résolution des problèmes entre équipes. Lorsqu'un incident survient, chacun, quel que soit son rôle, sait à qui transmettre l'alerte. Loft Orbital construit une culture dans laquelle chacun se sent habilité à trier et à résoudre les incidents sans se soucier des faux pas ou des désagréments. L'entreprise envisage également d'explorer Intelligence événementielle de PagerDuty des fonctionnalités permettant d’accroître encore l’efficacité de son processus de réponse aux incidents.

Pour savoir comment PagerDuty peut aider votre organisation, contactez votre gestionnaire de compte ou essayez un Essai gratuit de 14 jours aujourd'hui.