Activez la maintenance. Partez à la découverte. Cassez des choses.
Parfois, il faut juste bricoler. L'expérimentation, les essais et les erreurs font partie intégrante de l'expérience d'apprentissage et ouvrent la voie à des choses plus grandes et meilleures. Reed Richards Il n'est pas entré dans la zone négative du jour au lendemain, et il a peut-être libéré par inadvertance une ou deux monstruosités qui auraient pu conquérir le monde en cours de route. Mais ce n'est pas grave. Vous inventez le pistolet à rayons dont vous avez besoin pour résoudre le problème, au bon moment.
Vous le réparez et passez à autre chose.
En améliorant votre situation technique, vous pouvez arriver à des moments où vous savez que vous allez casser quelque chose (parfois volontairement). Autrefois, cela pouvait se traduire par des messages envoyés à des personnes à des moments aléatoires lors des déploiements, pendant les périodes de transition, les migrations de bases de données ou les changements de DNS. Vous avez peut-être envoyé des annonces à votre équipe disant des choses comme : « Ignorez les messages que vous êtes sur le point de recevoir pendant les 30 prochaines minutes environ. Je suis en train de rééquiper une partie de notre infrastructure Chef et je m'attends à de fausses alertes. »
Tu n'as plus besoin de faire ça.
Vous pouvez désormais activer temporairement, maintenance planifiée sur un certain nombre de services PagerDuty . Beaucoup d'entre vous ont déjà découvert cette fonctionnalité lors de vos pérégrinations quotidiennes sur le site Web de PagerDuty . Je vous salue, aventuriers invétérés. J'ai vu des gens planifier des opérations de maintenance avec des descriptions simples telles que « Déploiement », « Maintenance trimestrielle », « Démarrage de RDS » et « fdsaf » (très instructif 😉 ).
J'ai également vu des messages de désespoir : « Je suis en train d'être appelé à mort et, pour autant que je sache, tout va bien. »
Tout va bien. C'est ainsi que cette fonctionnalité a été conçue. Parfois, vous ne savez tout simplement pas ce qui ne va pas. Parfois, vous avez juste besoin que les choses se taisent pour avoir le temps de réfléchir. Mettez votre service en panne en mode « Maintenance immédiate en 1 clic ». Trouvez la solution. Réparez-la. Le service se réactivera automatiquement.
Les fenêtres de maintenance sont également conçues pour être 100 % scriptables. Vous pouvez scripter vos processus de déploiement pour désactiver un ensemble de services pendant les cinq minutes qui suivent votre déploiement, pendant que les liens symboliques s'inversent, que la charge moyenne se lisse et que tout ce qui semble un peu trop bruyant pour votre niveau de surveillance actuel fait ce qu'il fait. Personne ne veut être averti pour quelque chose qui n'est pas exploitable (ou exploitable à long terme, mais vous n'avez pas le budget pour y travailler maintenant).
Les fenêtres de maintenance sont là. Explorez un peu. Améliorez les choses. Cassez des trucs. Nous vous attendrons quand vous aurez terminé.