Reden wir über AIOps: Teil 1: Was genau ist AIOps?
Aktualisierung des Herausgebers: Seit der letzten Veröffentlichung dieses Blogs haben wir eine Reihe neuer Funktionen in unserer AIOps-Lösung angekündigt. Sie können mehr darüber in diesem Artikel lesen. Blogeintrag oder erfahren Sie mehr unter https://www.pagerduty.com/use-cases/aiops/
Dies ist der erste Teil einer zweiteiligen Blogserie zur Dekonstruktion von AIOps für ITOps-Leiter.
Wenn Sie mir für jedes Unternehmen, das behauptet, „KI“ zu verwenden, einen Dollar geben würden, wäre ich ziemlich gut dran. Aber als Vermarkter bin ich diesen Behauptungen gegenüber etwas skeptisch. Lassen Sie mich das erklären.
Erstens gibt es über 50 Anbieter in der Gartner-Marktführer für AIOps – das sind eine Menge AIOps-„Lösungen“. Wenn Sie sich dann in die Lage des Kunden versetzen, werden Sie sich wahrscheinlich fragen: „Woher weiß ich, was ich genau bekomme?“
Es ist hart da draußen. Unternehmen stehen stärker denn je unter Druck, ihr Geschäft umzugestalten, die Dinge voranzutreiben und schneller auf die Digitalisierung umzusteigen. Schon vor der Pandemie begannen viele IT-Organisationen, AIOps als potenziellen Investitionsbereich zu betrachten. Sie hoffen, dass Investitionen in diese neue Technologie den Betrieb verbessern, mehr datengesteuerte Erkenntnisse liefern und es ihnen ermöglichen, effizienter zu skalieren und Probleme schneller zu lösen.
Doch all dies wirft immer noch die Frage auf: Was ist AIOps eigentlich … und, was vielleicht noch wichtiger ist, ist das alles nur Hype?
Die Sache ist, ob Hype oder nicht, der Begriff wird nicht verschwinden. Um den Lärm um AIOps zu beseitigen, habe ich mich mit Julian Dunn, Director of Product Marketing bei PagerDuty, zusammengesetzt, um das Thema zu besprechen.
F: Ist AIOps bloß ein Marketing-Hype?
JD : Das mag so scheinen. Aber wenn wir das ganze Marketing weglassen, gibt es eine große Chance für KI und maschinelles Lernen (ML), eine wichtige Rolle bei der Echtzeitarbeit zu spielen. Wenn wir es unbedingt definieren müssten, wäre die einfachste Definition meiner Meinung nach, dass AIOps die „Zukunft des Monitorings“ ist, eine Definition, die nicht nur das Netzwerk, die Server und Anwendungen umfasst, sondern auch das vollständige digitale End-to-End-Kundenerlebnis – und die Fähigkeit, diese Bereiche miteinander in Beziehung zu setzen.
Bei Echtzeitvorgängen bietet AIOps das Potenzial, Einblicke in mehrere Domänen zu gewinnen und so einen detaillierten Kontext zu den zugrunde liegenden Ursachen von Ausfällen zu liefern. Nehmen wir an, eine Anwendung ist langsam. Können wir das bis zum Kunden zurückverfolgen? Lag die Ursache beispielsweise darin, dass viele Kunden ein bestimmtes Produkt kauften oder auf eine Weise mit unserer Site interagierten, die die Anwendung verlangsamte? Das ist der Traum, dem wir als Branche gerade in kleinen Schritten näher kommen.
Letztendlich klingen KI und maschinelles Lernen wie hochtrabende Begriffe, aber denken Sie daran: Im Grunde sind es Algorithmen, Mathematik und Statistik. Was wir heute haben, ist sowohl eine unglaubliche Menge an Daten als auch eine ebenso unglaubliche Menge an Rechenleistung in der Cloud, die wir auf diese Daten anwenden können, und zwar auf eine Art und Weise, die vor 10 Jahren noch nicht möglich war. Ironischerweise ist es also ein Problem, an dem ML-Algorithmen gerne herumkauen, wenn Kunden sagen: „Ich kann mit so vielen Daten nicht umgehen.“ Je mehr Daten Sie haben, desto praktikabler und genauer kann ein KI-Modell trainiert werden.
Ich möchte jedoch zur Vorsicht mahnen: Stellen Sie sicher, dass die Kunden das Geschäftsproblem, das sie mit AIOps lösen möchten, klar artikulieren können. Andernfalls ist es nur ein weiteres Spaßtool.
F: Was bewegt die Leute eigentlich dazu, AIOps zu kaufen?
JD : Es sind zwei Dinge, die wir von IT-Leitern am häufigsten hören:
- Sie wollen mit der gleichen Anzahl an Mitarbeitern mehr erreichen. Infrastruktur und Datenvolumen wachsen astronomisch, und sie verfügen nicht über das Betriebsbudget, um mehr Personal einzustellen.
- Sie möchten das Risiko verringern und hoffen, dass KI dabei hilft, die Grundursache schneller zu finden und die Menschen schneller dazu zu bringen, bei der Behebung der Probleme zusammenzuarbeiten.
Das ist also der Ausgangspunkt für das Versprechen der KI für Echtzeit-Operationen. Ich werde nicht leugnen, dass KI wertvoll ist und sein kann, aber sie ist sicherlich kein Allheilmittel, das alle Probleme der zentralen IT lösen wird. Manches von dem, was sie suchen, ist einfach nicht leicht zu erreichen, und manches davon ist im Bereich der Informatik möglicherweise nicht einmal möglich.
Mit aktuellen AIOps-Lösungen ist es beispielsweise möglich, Empfehlungen zum aktuellen Verhalten abzugeben, das dem früheren Verhalten sehr ähnelt. Beispiel: „Dienst X ist Dienst Y nachgelagert. Wir stellen fest, dass Vorfälle bei Dienst Y in den meisten Fällen innerhalb von 5 Minuten Vorfälle bei Dienst X verursachen. Empfehlung: Sehen Sie sich Dienst Y an, bevor Sie Dienst X betrachten.“
Was jedoch nicht möglich ist, ist die Fähigkeit, Verhaltensweisen vorherzusagen/zu erkennen, die stark von früheren Verhaltensweisen abweichen – was die Kunden aber wünschen und was viele Anbieter behaupten, können. In der Kybernetik nennt man das „Gesetz der erforderlichen Vielfalt“ (Sie können es nachschlagen).
Mit anderen Worten: Statistiken und Daten über vergangene Vorfälle und menschliches Verhalten, die kontinuierlich in ein KI-Modell eingespeist werden, können uns helfen, sichere Annahmen zu treffen, wenn sie eng mit vergangenen Vorfällen zusammenhängen. Viele Menschen suchen jedoch nach einer „KI-Zaubermaschine“, die ihnen hilft, Probleme zu erkennen und zu lösen, selbst wenn aktuelle Daten und Verhaltensweisen deutlich von den Beobachtungen in der Vergangenheit abweichen. Und genau darin liegt die Herausforderung – und Enttäuschung.
F: Lassen Sie mich hier kurz den Advocatus Diaboli spielen. Hat die IT tatsächlich ein AIOps-Problem?
JD : Unseren Beobachtungen zufolge haben unsere Kunden tatsächlich ein AIOps-Problem – es ist nur oft nicht das, was sie vermuten.
In den meisten Fällen – und unsere Gespräche mit Branchenanalysten bestätigen dies – ist es eine zentrale IT-Organisation, die eine AIOps-Lösung kaufen möchte. Typischerweise sind einige der „zu erledigenden Aufgaben“ Rauschreduzierung, Anomalieerkennung und Korrelation von Ereignissen über verschiedene Dienste hinweg. Ohne jedoch auf die Theorie einzugehen, stößt dies häufig auf dieselben Machbarkeitsprobleme, die ich oben erläutert habe – zum Beispiel ist es schwierig, etwas mit hoher Sicherheit als Anomalie zu bezeichnen, die Maßnahmen erfordert, wenn man es buchstäblich noch nie zuvor gesehen hat.
Der andere blinde Fleck zentraler IT-Organisationen besteht darin, dass sie häufig die Tatsache übersehen, dass sich die Betriebswelt verändert hat. Betriebsteams übernehmen zunehmend eine dezentrale „Full-Service-Verantwortung“, bei der Geschäftsbereiche ihre eigenen Technologieteams mit jeweils eigener Kultur, Geschwindigkeit, Toolchain usw. besetzen.
Interessanterweise macht diese Dezentralisierung AIOps tatsächlich praktikabler, da sie Ereignisse auf eine Weise trennt, die es Algorithmen erleichtert, darauf zu reagieren. Dennoch sehen wir oft, wie zentrale IT-Organisationen sich gegen den Wechsel zum dezentralen Ereignismanagement wehren, obwohl es das Leben für alle einfacher machen würde!
Darüber hinaus gibt es hier auch ein kulturelles und organisatorisches Problem. Ein AIOps-Ansatz, der sich nur auf die Bedürfnisse des zentralisierten Teams konzentriert, wird nicht den erforderlichen ROI liefern, denn wenn Sie eine solche Lösung kaufen und versuchen, sie dezentralisierten Teams aufzuzwingen, werden diese sich dagegen wehren, was es sehr schwierig macht, die von Ihnen erhofften Geschäftsziele zu erreichen.
Denken Sie an zentrale Teams, die versuchen, ITSM-Lösungen zu kaufen und sie den Entwicklern aufzudrängen – das geht selten gut. Und eines dieser Geschäftsziele, das in der Eile bei der Bereitstellung von Funktionen verloren geht, ist die Notwendigkeit der Zusammenarbeit technischer Teams, insbesondere zwischen zentralisierten und dezentralisierten Gruppen. Die ganze KI-gesteuerte Lärmreduzierung der Welt ist nicht hilfreich, wenn die Teams nicht kommunizieren, wenn etwas schief geht, weil sie sich weigern, die Tools der anderen zu verwenden.
Halten Sie nächste Woche Ausschau nach Teil 2 dieses Themas. Darin sprechen wir über wichtige Überlegungen, die IT-Leiter anstellen sollten, wenn sie auf dem Markt für eine AIOps-Lösung sind. Wir werden auch erläutern, welchen Ansatz und welche Investitionsbereiche PagerDuty verfolgt, um AIOps für unsere Kunden zum Leben zu erwecken.
Um den Lärm um AIOps noch weiter zu reduzieren, haben Julian und ich gemeinsam ein Webinar mit unserem SVP of Product and Product Marketing, Jonathan Rende, zusammengestellt, das genau dieses Thema behandelt. „AIOps erklärt: Was es ist und wie es Echtzeitoperationen verbessern kann.“ Sie können sich die Aufzeichnung auf Abruf zu Ihrer eigenen Zeit ansehen, um einen Eindruck davon zu bekommen, wie wir bei PagerDuty die vielen verschiedenen Philosophien rund um AIOps durchgehen, um unsere Perspektive auf das Thema zu formulieren. Im Webinar zeigt Jonathan auch Möglichkeiten, wie Sie Technologien bewerten können, die AIOps versprechen, um Ideen zu formulieren, wie es in Ihre umfassendere Strategie passen kann.
Dies ist nur die Spitze des Eisbergs dessen, was PagerDuty zu bieten hat, wenn Wir unterstützen unsere Kunden dabei, Intelligenz und Automatisierung optimal zu nutzen um die Echtzeitarbeit zu erleichtern, sodass Teams ihre Zeit auf Innovationen konzentrieren können, anstatt Probleme zu lösen. Außerdem werden wir in wenigen Wochen auf unserer jährlichen Konferenz, dem PagerDuty Summit, einige wichtige Produktankündigungen machen. Wenn Sie es also noch nicht getan haben, registrieren Sie sich noch heute kostenlos um Ihren Platz zu sichern!