Blog

La mission Juno de la NASA et ses opérations informatiques

par Ophir Ronen 7 septembre 2016 | 4 minutes de lecture

J'ai toujours voulu être un pilote de vaisseau spatial voyageant dans les étoiles. Bien qu'il y ait peu de chances que des voyages interstellaires se produisent de mon vivant, nous commençons à entrer dans une ère fascinante. Nous faisons des choses incroyables comme atterrissage sur des comètes ,   tester les moteurs ioniques , et même explorer Entraînements EM Ce qui est particulièrement passionnant en ce moment, c’est que l’humanité place une sonde autour de l’un des environnements les plus intenses du système solaire : l’orbite de Jupiter.

Environnements difficiles

La sonde Juno doit faire face à un environnement incroyablement hostile. Le plus grand défi est le rayonnement intense – 20 000 fois supérieur à celui de la Terre – auquel Juno ne survivra pas mais devra plutôt faire face pendant une courte période. « Une fois que ces électrons frappent un vaisseau spatial, ils commencent immédiatement à ricocher et à libérer de l'énergie, créant des photons et des particules secondaires, qui ricochent à leur tour », a déclaré Heidi Becker, responsable de l'équipe de surveillance des radiations de Juno, lors d'une conférence de presse l'année dernière. mois. « C'est comme une gerbe de balles radioactives. »

Pourquoi est-ce que j'évoque la mission Jupiter dans le contexte des opérations informatiques ? Comment tout cela est-il lié aux problèmes humains liés à l'exploitation d'un ITOps L'environnement ? La réponse est simple : les deux sont des environnements difficiles qui nécessitent une planification, des processus bien définis et des outils appropriés pour perdurer et prospérer. La version des opérations informatiques d'une rafale de balles de radiation est le flot parfois écrasant d'alertes non exploitables et exploitables provenant des différents systèmes de gestion.

Par le passé, nous appelions ces alertes non exploitables « bruit », mais nous nous éloignons de cette nomenclature à mesure que nous découvrons des pépites d'indicateurs de pointe et de pointe dans la mer de données d'alerte des opérations informatiques.

Suppression d'alerte

Lorsque mon ancienne entreprise, Siège social d'enrichissement des événements , a été acquis par PagerDuty à la fin de l'année dernière, l'espoir était d'augmenter l'excellente gamme existante de capacités de réponse aux incidents avec des améliorations axées sur la gestion des événements. Nous avons initié cet effort en créant notre Format d'événement commun PagerDuty (PD-CEF) avec lequel nous normalisons et structurons les alertes de vos systèmes de gestion. Ce faisant, nous posons les bases pour créer de nouveaux outils puissants qui vous aideront à accélérer la réponse aux incidents. En s'appuyant sur cette base solide de données d'événements normalisées, notre nouveau moteur de règles d'événements vous permet de classer des groupes d'alertes et d'agir sur eux, en commençant par la suppression des événements et des alertes. La suppression des alertes est nécessaire car notre philosophie pour gérer l'énorme charge d'alertes générées par l'infrastructure actuelle n'est pas de les abandonner mais de les supprimer.

Pourquoi supprimer les alertes ? Nos recherches ont montré que bon nombre de ces alertes dites « parasites » sont des indicateurs avancés de problèmes beaucoup plus graves. En envoyant plus d’événements plutôt que moins à PagerDuty, vous obtiendrez une compréhension beaucoup plus approfondie des flux d’événements et des clusters d’alertes dans votre infrastructure informatique à l’aide de nos nouveaux outils de visualisation des opérations informatiques.

L'avenir

Comme vous le verrez à Sommet PagerDuty , ces améliorations apportées à l'offre principale de PagerDuty iront bien au-delà de ce que vous avez vu de nous jusqu'à présent. Nous nous efforçons intensément de vous fournir les outils qui vous permettront d'avoir une compréhension plus approfondie et un contexte spécifique des problèmes et incidents qui ont un impact sur votre entreprise.

Un an après l'acquisition, je suis ravi d'annoncer que PagerDuty a fait un bond en avant vers l'avenir. Nous avons toujours adopté et continuerons d'adopter une méthodologie Lean et Agile conformément à Message précédent de Tim ; nous nous concentrons sur l'apprentissage et l'empathie comme décrit par Jonny ; et nous créons une fusion profonde des capacités de gestion des événements (données) et de gestion des incidents (personnes). Nous vivons une période enivrante chez PagerDuty.

Nous sommes maintenant à la semaine T-1 de Sommet PagerDuty où nous allons commencer cette aventure folle et vous présenter toutes ces nouvelles fonctionnalités. Si vous nous rejoignez au Village le 13 septembre, vous pourrez en faire l'expérience de première main. J'ai hâte de vous y voir !

 

Articles référencés :