Blog

Optimisation de la gestion des incidents pour les infrastructures hybrides

par Christophe Tozzi 15 juin 2016 | 4 minutes de lecture

Nous sommes en 2016 et votre infrastructure est probablement hybride. Cela signifie que vos solutions de gestion des incidents doivent également être prêtes pour les environnements hybrides. Si vous n'aviez que des serveurs sur site à gérer et si vous n'aviez pas de réseaux virtuels ou de microservices dans le mix, la gestion des incidents serait beaucoup plus simple.

Mais alors vous vivriez dans le passé, et Windows Server 2003 serait la dernière grande nouveauté dans les opérations informatiques.

Aujourd'hui, presque toutes les infrastructures sont hybrides d'une manière ou d'une autre. Les serveurs et les appareils sur site s'intègrent parfaitement aux services de cloud public et/ou privé. La mise en réseau est abstraite de la couche physique. Le stockage est évolutif et distribué sur de nombreux serveurs, parfois même entre des centres de données.

Alors, que doit faire un administrateur ? La réponse courte est d'adopter une solution de gestion des incidents adaptée à l'hybride. La réponse longue est expliquée ci-dessous, où je propose des conseils pour optimiser la gestion des incidents pour les infrastructures hybrides d'aujourd'hui.

Défis de la gestion des incidents avec une infrastructure hybride

Commençons par décrire les défis particuliers que pose l’infrastructure hybride pour la gestion des incidents.

  • Votre équipe de gestion des incidents n’a pas toujours un accès physique à l’ensemble de l’infrastructure. Si votre infrastructure s'étend sur plusieurs centres de données et/ou inclut des clouds, un administrateur d'un emplacement donné peut ne pas se trouver au même endroit que l'appareil qui déclenche une alerte.
  • Vous n’avez pas un contrôle total sur toute l’infrastructure. Les clouds publics ou privés peuvent être hébergés sur les serveurs de quelqu'un d'autre (sur lesquels vous n'avez qu'un contrôle limité).
  • Les périphériques physiques sont abstraits de l’infrastructure. Il devient alors plus difficile de déterminer si les alertes sont provoquées par des problèmes logiciels, matériels ou les deux. Par exemple, la source des alertes concernant les problèmes de système de fichiers sur un serveur virtuel peut être une défaillance matérielle du disque sur l'hôte, des erreurs logicielles du système de fichiers sur l'invité ou une combinaison des deux.
  • Votre infrastructure n’est pas limitée. Il évolue en permanence à mesure que de nouveaux appareils sont ajoutés ou supprimés, que le stockage s'étend, que les conteneurs montent et descendent, etc.

Résoudre le défi de la gestion des incidents grâce à une infrastructure hybride

Maintenant que nous avons abordé les défis, voici quelques suggestions à prendre en compte lors de la planification d’une stratégie de gestion des incidents d’infrastructure hybride :

  • Adopter la gestion des incidents plateforme (comme PagerDuty) que est suffisamment intelligent pour acheminer les alertes en fonction de la source du problème. De cette façon, une alerte générée dans un centre de données parviendra à coup sûr aux administrateurs qui contrôlent ce centre de données, plutôt qu'à une équipe située à un autre endroit.
  • Déployer un une plate-forme de gestion des incidents qui offre surveillance et alerte flexibles configurations et s'intègre facilement à votre environnement existant . Par cela, je veux dire que vous devriez pouvoir intégrer différents outils dans différentes parties de votre infrastructure en fonction de ce qui fonctionne le mieux pour cette partie spécifique. Dans vos serveurs cloud publics, vous souhaiterez peut-être utiliser AWS CloudWatch , et Nagios peut gérer vos serveurs sur site. Snort ou OSSEC peuvent surveiller les événements réseau. PagerDuty , par exemple, a Plus de 150 intégrations prêtes à l'emploi , qui peut s'intégrer à votre infrastructure hybride existante.
  • Envoyer toutes les alertes au hub central . Si tu avoir plusieurs plates-formes de surveillance, vous voulez vous assurer que les alertes sont vus ensemble dans un groupe ou un cluster. Sinon, ils deviendront difficiles à gérer et essayer d'établir un lien entre des problèmes potentiellement liés est impossible . UN plate-forme comme PagerDuty résout ce problème en fournissant un centre centralisé pour recevoir et normaliser toutes les différentes alertes provenant de votre hybride Infrastructure.
  • Assurez-vous que votre solution de gestion des incidents est évolutive. Étant donné que la taille de votre infrastructure n'est pas constante, vous souhaitez une plate-forme qui peut recevoir et stocker un volume variable d'alertes.
  • Soyez indépendant du fournisseur. Les solutions de gestion des incidents qui ne prennent en charge que certains systèmes d'exploitation ou fournisseurs de services ne fonctionneront pas pour les infrastructures hybrides. Les environnements hybrides sont généralement composés de divers composants matériels et logiciels, et gérés par des administrateurs qui souhaitent pouvoir échanger rapidement les pièces. solution comme PagerDuty est également utile à cette fin, car il peut s'intégrer à un logiciel de surveillance spécifique au fournisseur, puis traduire ces alertes pour les utiliser via une interface de gestion des incidents flexible et intégrée.

Certains des défis que j'ai évoqués ne semblent peut-être pas si importants pour votre organisation à l'heure actuelle. Il est vrai que certains environnements ne sont pas encore aussi hybrides que d'autres.

Mais la tendance est clairement à l'adoption d'infrastructures hybrides. Plus tôt vous adapterez vos solutions de gestion des incidents pour vous préparer à cet avenir, mieux vous serez en mesure de migrer entièrement vers des environnements hybrides sans affecter votre capacité à surveiller votre infrastructure.