Blog

La surveillance DevOps est une affaire de multi-outils

par Twain Taylor 17 août 2016 | 4 minutes de lecture

Les outils de surveillance sont destinés à faciliter la vie des DevOps équipe, et le choix du bon outil de surveillance DevOps peut faire toute la différence pour des flux de travail efficaces et des utilisateurs finaux plus satisfaits.

Les outils de surveillance DevOps sont disponibles dans toutes les tailles et toutes les formes

La boîte à outils de surveillance habituelle pour la plupart des équipes DevOps comprend (mais sans s'y limiter) :

  • un outil de surveillance des infrastructures
  • un outil de surveillance des performances des applications (APM)
  • un outil d'analyse de journaux

Plongeons dans chaque couche et voyons où elles s’intègrent dans votre processus de surveillance DevOps.


Surveillance des infrastructures et des réseaux

Ces outils peuvent surveiller l'ensemble de l'infrastructure et du réseau, y compris les serveurs, les routeurs et les commutateurs. Les outils de surveillance de l'infrastructure permettent d'identifier et de résoudre les problèmes d'infrastructure informatique avant qu'ils n'affectent les processus métier critiques. Ils peuvent vous aider à planifier les mises à niveau avant que les systèmes obsolètes ne commencent à provoquer des pannes. Les outils de surveillance de l'infrastructure et du réseau garantissent également que les interruptions de maintenance ont un impact minimal sur les utilisateurs.

En surveillant l'état de l'infrastructure, vous pouvez avoir une idée de l'état de santé des applications qui y sont exécutées. Cependant, ces outils ne surveillent pas l'application en tant qu'ensemble complet de services. En ce sens, ils adoptent une approche traditionnelle de la surveillance qui n'est pas la mieux adaptée aux applications cloud actuelles.
Exemple: Nagios , Zabbix

Surveillance des performances des applications

Les outils de surveillance des performances des applications, comme leur nom l'indique, surveillent les performances de votre application. Ils offrent une visibilité sur le comportement de votre application, détectent les problèmes qui affectent les utilisateurs et aident à résoudre rapidement ces problèmes. Ils surveillent le flux d'application de bout en bout et fournissent des traces qui incluent des détails au niveau du code. Les outils APM contiennent des diagnostics approfondis qui vous aident à trouver la ligne de code exacte qui peut être à l'origine d'un ralentissement ou d'une défaillance des performances.

Bien que les outils APM contribuent à améliorer les performances et à prévenir les temps d'arrêt et la latence, de nombreux problèmes nécessitent un dépannage plus approfondi que celui que l'APM peut fournir. Ces problèmes nécessitent l'indexation et la recherche de fichiers journaux. Malheureusement, les outils APM n'analysent pas les fichiers journaux et ne sont pas en mesure de détecter les attaques de sécurité. Vous avez besoin d'un outil d'analyse des journaux pour ce type d'analyse.
Exemple: Nouvelle relique , Dynamique des applications

Analyse des journaux

Les outils d'analyse des journaux offrent un moyen évolutif et fiable de stocker et d'indexer vos fichiers journaux. Ils peuvent effectuer des recherches rapides dans les fichiers, créer des analyses détaillées basées sur les données du journal et surveiller les violations de sécurité et les cyberattaques en fonction du fichier journal. Cependant, ils ne fournissent pas de surveillance des performances des applications de bout en bout et ne sont pas en mesure de révéler les traces au niveau du code
Exemple: Splunk , Pile élastique

 

Aucun de ces outils n'est conçu pour une surveillance de bout en bout. Si vous vous fiez uniquement à l'un de ces outils lorsqu'un incident se produit, vous manquerez toujours un élément clé pour la résolution.


Les outils de surveillance nécessitent encore plus de surveillance

Même si vous avez adopté tous ces outils de surveillance, la situation peut devenir chaotique lorsqu'un incident se produit. Les alertes de tous ces outils fournissent de nombreuses données qui se chevauchent. Cela signifie que vous finissez par regarder frénétiquement autour de vous et par passer d'un outil à l'autre, ce qui provoque beaucoup de frustration pour vos équipes ainsi que pour vos clients. Vos MTTR seront plus longs car vous serez confronté à une surcharge de données provenant de l'ensemble de votre ensemble d'outils. Ce dont vous avez besoin, c'est de simplifier votre surveillance grâce à la gestion des incidents.

Vous avez besoin d'une plateforme de gestion des incidents

IL , et plus encore les équipes DevOps, ont depuis longtemps accepté que la surveillance implique l'utilisation d'une combinaison d'outils de pointe, profondément intégrés les uns aux autres. Avec tous ces outils de surveillance en place, fournissant parfois des informations contradictoires et une quantité écrasante d'alertes, vous avez besoin d'un hub central pour les gérer tous et fournir un résumé de l'incident en cours. Une plate-forme de gestion des incidents comme PagerDuty Il est essentiel de mettre de l’ordre dans le chaos qui règne lors d’un incident.

Les outils de gestion des incidents font ressortir le signal du bruit en supprimant les alertes de faible priorité et en transmettant les alertes de haute priorité aux bonnes personnes, au bon moment. Parce qu'ils s'intègrent profondément à presque tous les autres systèmes de surveillance, les outils de gestion des incidents vous offrent une véritable surveillance de bout en bout dont chaque équipe DevOps a besoin. Grâce à des options de notification avancées, les solutions de gestion des incidents telles que PagerDuty permettent à votre équipe de choisir la manière dont elle souhaite être avertie. De plus, ces processus peuvent être automatisés, ce qui fait gagner beaucoup de temps à votre équipe et réduit le MTTR global.

Tous vos outils de surveillance offrent leur propre ensemble de fonctionnalités uniques, mais elles entraînent beaucoup de confusion s'ils ne sont pas bien gérés. Même si vous ne disposerez peut-être jamais d'un outil de surveillance unique pour DevOps, avoir la possibilité de gérer tous vos outils de surveillance à partir d'un seul endroit et de filtrer les données que vous recevez avec une plate-forme comme PagerDuty peut vous rapprocher de la perfection.