Der Blog

NASAs Juno-Mission und IT-Betrieb

von Ophir Ronen 7. September 2016 | 4 Minuten Lesezeit

Ich wollte schon immer Raumschiffpilot werden und die Sterne bereisen. Obwohl die Wahrscheinlichkeit, dass wir zu meinen Lebzeiten interstellare Reisen unternehmen werden, gering ist, stehen wir am Beginn einer faszinierenden Ära. Wir machen unglaubliche Dinge wie Landung auf Kometen ,   Testen von Ionentriebwerken und sogar das Erkunden EM-Antriebe . Besonders aufregend ist im Moment, dass die Menschheit eine Sonde in einer der intensivsten Umgebungen des Sonnensystems platziert – der Umlaufbahn des Jupiters.

Raue Umgebungen

Die Raumsonde Juno muss mit einer unglaublich rauen Umgebung zurechtkommen. Die größte Herausforderung ist die intensive Strahlung – 20.000-mal stärker als die der Erde –, die Juno nicht überleben, sondern für kurze Zeit aushalten muss. „Sobald diese Elektronen auf eine Raumsonde treffen, beginnen sie sofort abzuprallen und Energie freizusetzen, wodurch sekundäre Photonen und Partikel entstehen, die dann abprallen“, sagte Heidi Becker, Leiterin des Strahlungsüberwachungsteams von Juno, während einer Pressekonferenz im vergangenen Jahr. Monat. „Es ist wie ein Strahlensalvenhagel.“

Warum erwähne ich die Jupiter-Mission im Zusammenhang mit IT-Operationen? Wie hängt das alles mit den menschlichen Problemen beim Betrieb eines ITOps Umgebung? Die Antwort ist einfach: Beide sind raue Umgebungen, die Planung, klar definierte Prozesse und geeignete Werkzeuge erfordern, um zu überleben und zu gedeihen. Die IT-Operations-Version eines Strahlensalvens ist die manchmal überwältigende Flut von nicht umsetzbaren und umsetzbaren Warnungen, die von den verschiedenen Managementsystemen eintreffen.

In der Vergangenheit bezeichneten wir diese nicht umsetzbaren Warnmeldungen als „Rauschen“, doch wir entfernen uns von dieser Bezeichnung, da wir in der Flut von Warnmeldungsdaten zu IT-Vorgängen immer mehr Goldstücke an Früh- und Spätindikatoren entdecken.

Alarmunterdrückung

Als meine frühere Firma Veranstaltungsbereicherung HQ , wurde Ende letzten Jahres von PagerDuty übernommen, mit der Erwartung, das bereits bestehende hervorragende Angebot an Fähigkeiten zur Reaktion auf Vorfälle durch auf das Ereignismanagement ausgerichtete Verbesserungen zu ergänzen. Wir haben diese Initiative eingeleitet mit der Schaffung unseres Allgemeines Ereignisformat von PagerDuty (PD-CEF), mit dem wir Warnmeldungen aus Ihren Managementsystemen normalisieren und strukturieren. Auf diese Weise schaffen wir die Voraussetzungen für die Entwicklung neuer und leistungsstarker Tools, mit denen Sie die Reaktion auf Vorfälle beschleunigen können. Aufbauend auf dieser soliden Grundlage normalisierter Ereignisdaten können Sie mit unserer neuen Ereignisregel-Engine Gruppen von Warnungen klassifizieren und entsprechend reagieren, angefangen mit der Unterdrückung von Ereignissen und Warnungen. Die Unterdrückung von Warnungen ist notwendig, da unsere Philosophie im Umgang mit der enormen Menge an Warnungen, die von der heutigen Infrastruktur generiert werden, nicht darin besteht, sie zu löschen, sondern sie zu unterdrücken.

Sie fragen sich, warum Warnungen unterdrückt werden? Unsere Untersuchungen haben gezeigt, dass viele dieser sogenannten „Lärm“-Warnungen Frühindikatoren für viel schwerwiegendere Probleme sind. Indem Sie mehr Ereignisse an PagerDuty senden, erhalten Sie mithilfe unserer neuen Visualisierungstools für IT-Operationen ein viel tieferes und umfassenderes Verständnis der Ereignisflüsse und Warncluster in Ihrer IT-Infrastruktur.

Die Zukunft

Wie Sie sehen werden bei PagerDuty Gipfel , diese Erweiterungen des Kernangebots von PagerDuty gehen weit über das hinaus, was Sie bisher von uns gesehen haben. Wir konzentrieren uns intensiv darauf, Ihnen die Werkzeuge bereitzustellen, mit denen Sie ein tieferes Verständnis und einen spezifischen Kontext für Probleme und Vorfälle erhalten, die Ihr Unternehmen betreffen.

Jetzt, ein Jahr nach der Übernahme, freue ich mich, berichten zu können, dass PagerDuty einen evolutionären Sprung in die Zukunft gemacht hat. Wir haben immer schlanke und agile Methoden verfolgt und werden dies auch weiterhin tun. Tims früherer Beitrag ; Wir konzentrieren uns auf Lernen und Empathie, wie beschrieben von Jonny ; und wir schaffen eine tiefgreifende Fusion von Event-Management- (Daten) und Incident-Management-Funktionen (Mitarbeiter). Dies sind aufregende Zeiten hier bei PagerDuty.

Wir sind jetzt T-1 Woche entfernt von PagerDuty Gipfel wo wir loslegen diese wilde Fahrt und stelle Ihnen all diese neuen Möglichkeiten vor. Wenn Sie am 13. September zu uns ins The Village kommen, können Sie es aus erster Hand erleben. Ich freue mich darauf, Sie dort zu sehen!

 

Zitierte Artikel: