- PagerDuty /
- Der Blog /
- Zuverlässigkeit /
- Wartung einschalten. Auf Entdeckungsreise gehen. Sachen kaputt machen.
Der Blog
Wartung einschalten. Auf Entdeckungsreise gehen. Sachen kaputt machen.
Manchmal muss man einfach basteln. Experimentieren, Ausprobieren und Fehler machen ist ein wesentlicher Bestandteil des Lernprozesses und das Tor zu größeren und besseren Dingen. Reed Richards ist nicht über Nacht in die Negative Zone gekommen und hat vielleicht auf dem Weg dorthin versehentlich ein oder zwei potentielle Welteroberer-Monstrositäten freigelassen. Aber das ist OK. Sie erfinden genau zum richtigen Zeitpunkt die Strahlenpistole, die Sie brauchen, um das Problem zu lösen.
Sie beheben das Problem und fahren fort.
Während Sie Ihre technische Situation verbessern, kann es passieren, dass Sie wissen, dass Sie etwas kaputt machen werden (manchmal absichtlich). Früher hat dies möglicherweise dazu geführt, dass Benutzer während Bereitstellungen, Übergangsphasen, Datenbankmigrationen oder DNS-Flips zu beliebigen Zeiten per Paging benachrichtigt wurden. Möglicherweise haben Sie Ihrem Team Ankündigungen gesendet, in denen stand: „Ignorieren Sie die Paging-Nachrichten, die Sie in den nächsten 30 Minuten oder so erhalten werden. Ich rüste einen Teil unserer Chef-Infrastruktur um und erwarte einige Fehlalarme.“
Das brauchst du nicht mehr zu tun.
Sie können nun temporäre, geplante Wartung auf einer beliebigen Anzahl von PagerDuty -Diensten. Viele von Ihnen haben die Funktion bereits bei Ihren täglichen Streifzügen durch die PagerDuty -Website entdeckt. Ich ziehe meinen Hut vor Ihnen, tapfere Abenteurer. Ich habe Leute gesehen, die Wartungen mit einfachen Beschreibungen wie „Bereitstellen“, „Vierteljährliche Wartung“, „RDS überspringen“ und „fdsaf“ (sehr informativ 😉) planen.
Ich habe auch verzweifelte Nachrichten gesehen: „Ich werde zu Tode gepiept, und soweit ich das beurteilen kann, ist nichts falsch.“
Das ist alles in Ordnung. So ist diese Funktion gedacht. Manchmal weiß man einfach nicht, was los ist. Manchmal muss man einfach alles zum Schweigen bringen, damit man Zeit zum Nachdenken hat. Versetzen Sie Ihren kaputten Dienst mit „Sofortwartung mit 1 Klick“ in eine Stunde Ruhepause. Finden Sie es heraus. Beheben Sie es. Der Dienst wird automatisch wieder aktiviert.
Wartungsfenster sollen außerdem zu 100 % skriptfähig sein. Sie können Ihre Bereitstellungsprozesse so skripten, dass eine Reihe von Diensten für die nächsten fünf Minuten nach der Bereitstellung deaktiviert wird, während Symlinks umgeschaltet werden, die durchschnittliche Auslastung ausgeglichen wird und alles andere, was für Ihre aktuelle Überwachungsebene einfach zu laut zu sein scheint, das tut, was es tut. Niemand möchte für etwas angepiept werden, das nicht umsetzbar ist (oder langfristig umsetzbar ist, für das Sie aber im Moment nicht das Budget haben, um daran zu arbeiten).
Die Wartungsfenster sind da. Erkunden Sie die Dinge. Verbessern Sie sie. Machen Sie Dinge kaputt. Wir warten auf Sie, wenn Sie fertig sind.