Blog

Parlons AIOps : Partie 1 : Qu'est-ce que AIOps, exactement ?

par Vivian Chan 9 septembre 2020 | 8 min de lecture

Mise à jour de l'éditeur : Depuis la dernière publication de ce blog, nous avons annoncé un certain nombre de nouvelles fonctionnalités dans notre solution AIOps. Vous pouvez en savoir plus sur elles dans cet article article de blog ou apprenez-en plus sur https://www.pagerduty.com/use-cases/aiops/

Il s'agit du premier d'une série de blogs en deux parties déconstruisant l'AIOps pour les dirigeants de l'ITOps.


Si vous me donniez un dollar pour chaque entreprise qui prétend utiliser l'IA, je m'en sortirais plutôt bien. Mais en tant que spécialiste du marketing, je ne peux m'empêcher d'être un peu sceptique quant à ces affirmations. Laissez-moi vous expliquer.

Premièrement, il y a plus de 50 vendeurs dans le Guide du marché Gartner pour AIOps, cela représente beaucoup de « solutions » AIOps. Essayez alors de vous mettre à la place du client et vous commencerez probablement à vous demander : « Comment puis-je savoir exactement ce que j'obtiens ? »

La situation est difficile. Les entreprises sont plus que jamais poussées à transformer leurs activités, à aller plus loin et à passer au numérique plus rapidement. Avant même que la pandémie ne frappe, de nombreuses organisations informatiques commençaient déjà à se tourner vers l'AIOps comme domaine d'investissement potentiel. Elles espèrent qu'investir dans cette nouvelle technologie améliorera leurs opérations, leur fournira des informations plus basées sur les données et leur permettra d'évoluer plus efficacement et de résoudre les problèmes plus rapidement.

Mais tout cela soulève toujours la question : qu’est-ce que l’AIOps réellement… et, peut-être plus important encore, est-ce que tout cela n’est que du battage médiatique ?

Le fait est que, battage médiatique ou pas, le terme ne mène nulle part. Pour aider à dissiper le bruit autour de l'AIOps, j'ai rencontré Julian Dunn, directeur du marketing produit chez PagerDuty, pour faire le point sur le sujet.


Q : AIOps n’est-il qu’un simple argument marketing ?

JD :Cela peut sembler être le cas. Mais si nous éliminons tout le marketing, l’IA et l’apprentissage automatique (ML) ont une grande opportunité de jouer un rôle important dans le travail en temps réel. Si nous devions absolument le définir, je pense que la définition la plus simple serait qu’AIOps est « l’avenir de la surveillance », un avenir qui comprend non seulement le réseau, les serveurs et les applications, mais aussi l’expérience client numérique de bout en bout, et la capacité à relier ces domaines les uns aux autres.

Pour les opérations en temps réel, AIOps a le potentiel de créer des informations sur plusieurs domaines pour aider à fournir un contexte approfondi sur les causes sous-jacentes des pannes. Supposons qu'une application soit lente. Pouvons-nous relier cela jusqu'au client ? La cause est-elle due, par exemple, à un déluge de clients achetant un produit spécifique ou interagissant avec notre site d'une manière qui a ralenti l'application ? C'est le rêve vers lequel nous nous dirigeons à peine en tant qu'industrie.

En fin de compte, l’IA et l’apprentissage automatique peuvent sembler être des termes sophistiqués, mais n’oubliez pas : il s’agit d’algorithmes, de mathématiques et de statistiques. Nous disposons aujourd’hui d’une quantité incroyable de données et d’une puissance de calcul tout aussi incroyable dans le cloud, que nous pouvons exploiter d’une manière qui n’était pas possible il y a 10 ans. Par conséquent, lorsque les clients disent « Je ne peux pas gérer autant de données », il s’agit en fait d’un problème que les algorithmes de machine learning adorent résoudre. Plus vous avez de données, plus un modèle d’IA peut être conçu de manière à être réalisable et précis.

Je tiens toutefois à mettre en garde les clients, qui doivent pouvoir exprimer clairement le problème commercial qu'ils tentent de résoudre avec AIOps. Sinon, ce n'est qu'un outil amusant parmi tant d'autres.

Q : Qu’est-ce qui pousse réellement les gens à acheter AIOps ?

JD :Il y a deux choses que nous entendons le plus souvent de la part des responsables informatiques :

  • Ils veulent faire plus avec le même nombre de personnes. Les volumes d'infrastructures et de données augmentent de manière astronomique, et ils n'ont pas le budget de fonctionnement pour recruter davantage de personnel.
  • Ils veulent réduire les risques et espèrent que l’IA aidera à trouver la cause profonde plus rapidement et à inciter les gens à collaborer pour résoudre les problèmes plus rapidement.

Voilà donc le point de départ de la promesse de l’IA pour les opérations en temps réel. Je ne nierai pas le fait que l’IA est et peut être précieuse, mais elle n’est certainement pas une solution miracle qui résoudra tous les problèmes de l’informatique centrale. Certaines des choses qu’ils recherchent ne sont tout simplement pas facilement réalisables, et certaines d’entre elles ne sont peut-être même pas possibles dans le domaine de l’informatique.

Par exemple, avec les solutions AIOps actuelles, il est possible de formuler des recommandations sur le comportement actuel qui ressemblent étroitement au comportement passé. Par exemple, « Le service X est en aval du service Y. Nous remarquons que la plupart du temps, les incidents sur le service Y entraînent des incidents sur le service X dans les 5 minutes. Recommandation : examinez le service Y avant le service X. »

Ce qui n'est pas réalisable, en revanche, c'est la capacité de prédire/détecter des comportements qui s'écartent considérablement des comportements passés, ce que souhaitent les clients et ce que de nombreux fournisseurs prétendent pouvoir faire. En cybernétique, cela s'appelle la « loi de la variété requise » (vous pouvez la consulter).

En d’autres termes, les statistiques et les données sur les incidents passés et le comportement humain alimentées en continu dans un modèle d’IA peuvent nous aider à formuler des hypothèses en toute confiance si elles sont étroitement liées à des incidents passés. Mais de nombreuses personnes recherchent une « machine magique d’IA » qui les aidera à détecter et à résoudre les problèmes même lorsque les données et le comportement actuels sont sensiblement différents de ce qui a été observé dans le passé, et c’est là que réside le défi – et la déception.

Q : Alors laissez-moi jouer le rôle de l'avocat du diable pendant une minute. Le service informatique a-t-il réellement un problème AIOps ?

JD :D'après ce que nous avons vu, nos clients ont effectivement un problème AIOps, mais ce n'est souvent pas celui qu'ils pensent avoir.

La plupart du temps, et nos conversations avec les analystes du secteur le confirment, c'est une organisation informatique centrale qui cherche à acheter une solution AIOps. En général, certaines des « tâches à accomplir » sont la réduction du bruit, la détection des anomalies et la corrélation des événements entre les services. Sans entrer dans la théorie, cependant, cela se heurte souvent aux mêmes problèmes de faisabilité que ceux que j'ai évoqués ci-dessus. Par exemple, il est difficile d'étiqueter avec une grande certitude quelque chose comme une anomalie qui nécessite une action si vous ne l'avez littéralement jamais vu auparavant.

L’autre point aveugle des organisations informatiques centrales est qu’elles oublient souvent que le monde des opérations a changé. Les équipes d’exploitation assument de plus en plus une « propriété de service complet » décentralisée, où les secteurs d’activité dotent leurs propres équipes technologiques, chacune avec sa propre culture, sa propre vélocité, sa propre chaîne d’outils, etc.

Il est intéressant de noter que cette décentralisation facilite la mise en œuvre d'AIOps, car elle sépare les événements d'une manière qui facilite le fonctionnement des algorithmes. Pourtant, nous voyons souvent des organisations informatiques centrales lutter contre le passage à une gestion décentralisée des événements, même si cela faciliterait la vie de tout le monde !

De plus, il y a ici aussi un problème culturel et organisationnel. Une approche AIOps qui se concentre uniquement sur les besoins de l'équipe centralisée ne fournira pas le retour sur investissement requis, car si vous achetez une telle solution et essayez de l'imposer aux équipes décentralisées, ces dernières s'y opposeront, ce qui rendra très difficile la réalisation des objectifs commerciaux que vous espériez.

Pensez aux équipes centrales qui essaient d’acheter des solutions ITSM et de les imposer aux développeurs : cela se passe rarement bien. Et l’un des objectifs commerciaux qui se perd dans la précipitation à fournir des fonctionnalités est la nécessité pour les équipes techniques de collaborer, en particulier entre les groupes centralisés et décentralisés. Toute la réduction du bruit générée par l’IA au monde ne sert à rien si les équipes ne communiquent pas lorsque les choses tournent mal parce qu’elles refusent d’utiliser les outils des autres.

Restez à l'écoute de la deuxième partie de ce sujet la semaine prochaine, où nous aborderons les considérations clés auxquelles les responsables informatiques doivent réfléchir s'ils recherchent une solution AIOps. Nous partagerons également l'approche et les domaines d'investissement de PagerDuty pour donner vie à AIOps pour nos clients.


Pour contribuer davantage à réduire le bruit autour de l'AIOps, Julian et moi avons collaboré pour organiser un webinaire mettant en vedette notre vice-président directeur des produits et du marketing produit, Jonathan Rende, abordant ce sujet précis. 'AIOps expliqué : qu'est-ce que c'est et comment il peut stimuler les opérations en temps réel.' Vous pouvez regarder l'enregistrement à la demande pendant votre temps libre pour avoir un aperçu de la façon dont nous, chez PagerDuty, parcourons les nombreuses philosophies différentes autour de ce que peut être l'AIOps pour formuler notre point de vue sur le sujet. Dans le webinaire, Jonathan partage également des façons d'évaluer les technologies qui promettent à l'AIOps de formuler des idées sur la manière dont elle peut s'intégrer dans votre stratégie plus large.

Ce n'est que la pointe de l'iceberg de ce que PagerDuty a à offrir lorsque aider nos clients à tirer parti de l'intelligence et de l'automatisation pour alléger le travail en temps réel afin que les équipes puissent consacrer leur temps à innover au lieu de lutter contre les incendies. Nous avons également de grandes annonces de produits à venir lors de notre conférence annuelle, PagerDuty Summit, dans quelques semaines seulement, donc si ce n'est pas déjà fait, inscrivez-vous gratuitement aujourd'hui pour réserver votre place !