Plan directeur d'un système de planification des astreintes
La série sur les meilleures pratiques en matière de planification des astreintes est de retour ! première série de bonnes pratiques de garde , nous avons abordé le type d'équipement nécessaire et la manière dont les personnes souhaitent être alertées lorsqu'elles sont en service. deuxième partie de la série , nous avons abordé la question de savoir qui devrait faire partie d’une politique d’escalade d’astreinte.
La meilleure façon de faire face à tout scénario de panne est de planifier à l'avance. Du maintien de plannings prévisibles à l'analyse des tendances en matière d'incidents, suivez ces 5 bonnes pratiques lors de la création d'un système de planification d'astreinte pour être prêt à faire face à tout incident informatique.
1. Restez cohérent. Avant tout, votre planning d’astreinte doit être prévisible, régulier et équitable. Votre équipe ne doit jamais être surprise lorsqu’elle est d’astreinte. Elle doit également être équipée des bons outils, comme des téléphones portables, pour ne jamais manquer une alerte lorsqu’elle est loin de son bureau ou de son domicile.
2. Désignez un homme (ou une femme) de référence. Une seule personne doit être chargée de configurer le planning d'astreinte, avec l'aide de l'équipe, bien entendu. En général, cette personne doit être le responsable informatique. Idéalement, le planning doit être automatisé afin qu'une fois configuré, il ne soit pas nécessaire de le maintenir constamment. Si des modifications sont nécessaires, par exemple en cas d'absence pour maladie, utilisez des dérogations au lieu de reconfigurer l'ensemble du planning.
3. Ajoutez plus de mains sur le pont. Une politique d'alerte doit gérer les escalades pour plusieurs scénarios. Si l'ingénieur principal d'astreinte ne résout pas le problème en X minutes, quelqu'un d'autre doit être averti dès que possible. Si l'incident est de niveau 1, davantage de personnes doivent être alertées pour résoudre le problème plus rapidement. N'ayez jamais peur de trop vous impliquer.
4. Sachez comment vous performez. Une équipe efficace a une bonne connaissance des indicateurs de gestion des incidents et peut répondre à la question « Combien de fois notre équipe a-t-elle été appelée la semaine dernière ? » en 30 secondes. Examinez régulièrement les données pour vous assurer que les processus appropriés sont en place pour gérer tous les problèmes du système afin de réduire le nombre total d'incidents et leur temps moyen de réparation (MTTR). Analysez les tendances et étiquetez les alertes dans le système de surveillance, ou définissez de meilleurs seuils d'alerte pour réduire la lassitude liée aux alertes.
5. Pensez à vos clients. Créez une culture dans laquelle chacun comprend l'importance de s'assurer que votre logiciel fonctionne correctement pour vos clients. Un processus d'astreinte bien rodé n'en est qu'un sous-produit. Vous devez embaucher les bonnes personnes qui se soucient de fournir un excellent produit à vos clients à tout moment.
Mettre en place un système d'astreinte est plus facile à dire qu'à faire. Le changement culturel prend du temps et les processus évolueront. Il est important de ne pas mettre cela en place dans une boîte noire. Demandez à votre équipe de vous donner son avis sur ce qu'elle considère comme une rotation d'astreinte équitable, sur la manière dont elle souhaite être alertée et sur d'autres détails. Elle sera plus qu'heureuse de donner son avis et il sera plus facile d'obtenir son adhésion.