Blog

Qu’est-ce que AIOps et pourquoi devrais-je m’en soucier ?

par Jerry Weltsch 3 décembre 2020 | 5 minutes de lecture

L’intelligence artificielle pour les opérations informatiques (AIOps) signifie beaucoup de choses différentes pour beaucoup de personnes différentes, il est donc difficile de définir ce qu’elle est et ce qu’elle fait. À une époque où l’accélération numérique est la priorité zéro, les entreprises évaluent les changements culturels vers de nouveaux modèles opérationnels comme la propriété des services pour gagner en efficacité dans un monde complexe d’environnements de cloud hybride, AIOps apparaît comme un investissement potentiel intéressant pour résoudre les problèmes informatiques centraux. Mais qu’est-ce que c’est et que peut-elle réellement vous apporter ?

Nancy Gohring, analyste principale chez 451 Research, connaît mieux que quiconque la difficulté de définir l'AIOps. Elle a mené une série d'enquêtes auprès de professionnels des opérations informatiques et des développeurs pour comprendre comment ils perçoivent l'AIOps et comment ils peuvent l'appliquer. Nous avons demandé à Nancy d'approfondir un peu la question en interrogeant ces professionnels. Elle a constaté que les réponses étaient très diverses.

D’après ses recherches sur ce sujet, une chose qu’elle a pu déclarer est que l’AIOps peut être largement défini comme tout outil de la chaîne d’outils de surveillance et de réponse aux incidents qui utilise l’intelligence artificielle et/ou l’apprentissage automatique (IA/ML).

Avec cette définition en tête, Nancy a proposé quelques suggestions sur ce qu’il faut rechercher lors de l’évaluation des outils et solutions AIOps.

Profitez des avantages potentiels de l'IA/ML, mais ne vous laissez pas distraire par le marketing AIOps

Recherchez des solutions qui facilitent l’adoption de l’IA/ML pour la réduction du bruit des alertes, telles que des outils qui :

  • Disposez de modèles d'apprentissage automatique pré-entraînés qui vous permettent de démarrer en quelques jours au lieu de quelques mois
  • Peut fonctionner avec des infrastructures sur site, basées sur le cloud et hybrides
  • Normaliser les formats de données provenant de sources multiples pour intégrer un ensemble disparate d'outils de surveillance
  • Utiliser l'apprentissage automatique en complément des approches basées sur des règles pour garantir des résultats utiles
Regardez vers le passé

Évaluez les outils et les solutions qui exploitent les données des actions passées des intervenants pour mieux éclairer les actions et les réponses futures. En outre, examinez les solutions qui permettent la correction automatique pour résoudre plus rapidement les incidents.

Il ne s’agit pas seulement de technologie : n’oubliez pas que les personnes et les processus sont essentiels

Obtenir la bonne personne pour répondre au bon moment devient de plus en plus difficile avec la complexité accrue introduite par l'utilisation des microservices et des pratiques DevOps, il est donc essentiel de disposer d'une solution capable d'alerter la bonne personne au bon moment.

Pensez grand pour étayer votre argumentaire commercial

La réduction du temps moyen de reconnaissance (MTTA) et du temps moyen de résolution (MTTR) des incidents est un objectif important pour une équipe d'exploitation informatique, mais qu'est-ce que cela signifie réellement pour l'entreprise ? Lorsque vous établissez l'analyse de rentabilisation d'une solution AIOps incluant la réponse aux incidents, assurez-vous également d'aborder les résultats commerciaux améliorés. Les résultats incluent des éléments tels que l'évitement ou la réduction des temps d'arrêt qui se traduisent par une amélioration de l'expérience client et de la protection des revenus, en plus d'une productivité accrue des développeurs et des opérateurs qui peuvent désormais consacrer moins de temps à des tâches non planifiées.

L'unification des données et des processus peut améliorer la réponse aux incidents

La centralisation des données d'alerte provenant des outils de surveillance sur une seule plateforme permet aux équipes distribuées de mieux orchestrer une réponse efficace aux incidents et de favoriser une approche plus collaborative, ce qui améliore le moral et la productivité du personnel.

Adoptez l'automatisation

L’automatisation ne se limite pas à la correction (dont l’adoption peut prendre du temps pour beaucoup), mais elle permet également de supprimer la corvée de la réponse aux incidents en automatisant des tâches spécifiques du processus de réponse aux incidents. Ces tâches comprennent l’alerte de la bonne personne au bon moment, la mise en place d’une téléconférence avec l’équipe d’intervention, l’accès au bon livre de procédures, la communication des mises à jour de statut aux parties prenantes de l’entreprise et la génération de rapports d’autopsie des incidents.

PagerDuty est d'accord avec la conclusion de Nancy dans cet article selon laquelle le simple fait d'acheter le bon ensemble d'outils AIOps n'est pas une solution miracle. Pour tirer le meilleur parti de ce que ces outils ont à offrir, vous devez les intégrer à une stratégie globale de gestion des événements et de réponse aux incidents.

PagerDuty estime qu'une telle stratégie doit inclure une évaluation de la manière dont les équipes de votre organisation possèdent et exploitent leurs services. Il est particulièrement important, lorsque l'on envisage de nouvelles technologies comme AIOps, de comprendre comment elles s'intègrent à vos modèles d'exploitation existants. Alors que les entreprises se tournent de plus en plus vers le cloud pour bénéficier d'une meilleure évolutivité et d'une meilleure agilité, les organisations techniques évoluent pour prendre en charge de plus en plus d'applications et de microservices dans des environnements de plus en plus hybrides.

Cette augmentation de la complexité des technologies implique également des changements pour les personnes et les processus correspondants. Les équipes adoptent de plus en plus une forme décentralisée, où les secteurs d'activité dotent souvent leurs propres équipes technologiques, chacune avec sa propre culture, sa propre vitesse et sa propre chaîne d'outils. Les responsables informatiques qui souhaitent acheter des solutions AIOps doivent s'assurer qu'ils gardent à l'esprit à la fois les équipes centralisées et les équipes décentralisées (où les développeurs possèdent et maintiennent individuellement leur code en production) pour s'assurer qu'ils obtiendront le bon retour sur investissement avec l'utilisation.

Téléchargez ce rapport de 451 Research pour en savoir plus sur les leçons que vous pouvez tirer de Nancy Gohring et sur la manière dont PagerDuty AIOps peut vous aider, vous et votre organisation, à réaliser la transformation vers DevOps et la propriété à service complet.