Der Blog

Was ist AIOps und warum sollte es mich interessieren?

von Jerry Weltsch 3. Dezember 2020 | 5 Minuten Lesezeit

Künstliche Intelligenz für den IT-Betrieb (AIOps) bedeutet für viele Menschen viele verschiedene Dinge, daher ist es schwierig, eine Definition dessen zu finden, was es ist und was es tut. In einer Zeit, in der die digitale Beschleunigung Priorität Null hat, prüfen Unternehmen kulturelle Veränderungen hin zu neuen Betriebsmodellen wie Service Ownership, um die Effizienz in einer komplexen Welt hybrider Cloud-Umgebungen zu steigern. AIOps erweist sich als attraktive potenzielle Investition zur Lösung zentraler IT-Probleme. Aber was ist das und was kann es tatsächlich für Sie tun?

Nancy Gohring, Senior Analyst bei 451 Research, weiß wie schwer es ist, AIOps zu definieren. Sie hat eine Reihe von Umfragen unter IT-Betriebs- und Entwicklungsexperten durchgeführt, um zu verstehen, wie diese AIOps sehen und wie sie es anwenden. Wir haben Nancy gebeten, mit einigen Interviews mit den besagten Experten etwas tiefer einzutauchen. Dabei stellte sie fest, dass die Antworten sehr unterschiedlich ausfielen.

Aufgrund ihrer Forschung zu diesem Thema konnte sie Folgendes feststellen: AIOps kann im weitesten Sinne als jedes Tool in der Überwachungs- und Vorfallreaktions-Toolkette definiert werden, das künstliche Intelligenz und/oder maschinelles Lernen (KI/ML) verwendet.

Vor dem Hintergrund dieser Definition machte Nancy einige Vorschläge, worauf bei der Bewertung von AIOps-Tools und -Lösungen zu achten ist.

Nutzen Sie die potenziellen Vorteile von KI/ML, aber lassen Sie sich nicht vom AIOps-Marketing ablenken

Suchen Sie nach Lösungen, die die Einführung von KI/ML zur Reduzierung von Alarmgeräuschen erleichtern, beispielsweise nach Tools, die:

  • Nutzen Sie vorab trainierte Modelle für maschinelles Lernen, mit denen Sie innerhalb weniger Tage statt Monate loslegen können.
  • Kann mit lokalen, Cloud-basierten und hybriden Infrastrukturen arbeiten
  • Standardisieren Sie Datenformate aus mehreren Quellen, um unterschiedliche Überwachungstools zu integrieren.
  • Nutzen Sie maschinelles Lernen zusätzlich zu regelbasierten Ansätzen, um nützliche Ergebnisse sicherzustellen
Blick in die Vergangenheit

Bewerten Sie Tools und Lösungen, die Daten aus früheren Aktionen der Einsatzkräfte nutzen, um zukünftige Aktionen und Reaktionen besser zu planen. Sehen Sie sich außerdem Lösungen an, die automatische Korrekturen ermöglichen, um Vorfälle schneller zu lösen.

Es geht nicht nur um Technologie: Vergessen Sie nicht, dass Menschen und Prozesse der Schlüssel sind

Mit der zunehmenden Komplexität durch den Einsatz von Microservices und DevOps-Praktiken wird es immer schwieriger, die richtige Person zum richtigen Zeitpunkt zum Reagieren zu bewegen. Daher ist eine Lösung, die die richtige Person zum richtigen Zeitpunkt alarmieren kann, von entscheidender Bedeutung.

Denken Sie in großen Dimensionen, um den Business Case zu untermauern

Die Reduzierung der mittleren Zeit bis zur Bestätigung (MTTA) und der mittleren Zeit bis zur Lösung (MTTR) von Vorfällen ist ein großartiges Ziel für ein IT-Betriebsteam, aber was bedeutet das wirklich für das Unternehmen? Wenn Sie den Business Case für eine AIOps-Lösung einschließlich Vorfallreaktion erstellen, sollten Sie auch die verbesserten Geschäftsergebnisse berücksichtigen. Zu den Ergebnissen gehören Dinge wie die Vermeidung oder Reduzierung von Ausfallzeiten, was sich in einem verbesserten Kundenerlebnis und Umsatzschutz niederschlägt, sowie eine gesteigerte Produktivität von Entwicklern und Betreibern, die jetzt weniger Zeit mit ungeplanten Arbeiten verbringen müssen.

Durch die Vereinheitlichung von Daten und Prozessen kann die Reaktion auf Vorfälle verbessert werden

Durch die Zentralisierung der Warndaten von Überwachungstools auf einer einzigen Plattform können verteilte Teams eine effektivere Reaktion auf Vorfälle besser koordinieren und einen stärker kollaborativen Ansatz verfolgen, was zu einer verbesserten Arbeitsmoral und Produktivität der Mitarbeiter führt.

Nutzen Sie die Automatisierung

Bei der Automatisierung geht es nicht nur um die Behebung von Problemen – was für viele eine gewisse Zeit in Anspruch nehmen kann –, sondern sie ist auch nützlich, um die Mühen der Reaktion auf Vorfälle zu verringern, indem bestimmte Aufgaben im Reaktionsprozess automatisiert werden. Zu diesen Aufgaben gehören die Benachrichtigung der richtigen Person zur richtigen Zeit, die Einrichtung einer Telefonkonferenz des Reaktionsteams, der Zugriff auf das richtige Runbook, die Übermittlung von Statusaktualisierungen an Geschäftspartner und die Erstellung von Post-Mortem-Berichten zu Vorfällen.

PagerDuty stimmt Nancys Schlussfolgerung in diesem Artikel zu, dass der bloße Kauf des richtigen Satzes an AIOps-Tools kein Allheilmittel ist. Um das Beste aus den Vorteilen dieser Tools herauszuholen, müssen Sie sie in eine umfassende Strategie für Eventmanagement und Incident Response integrieren.

PagerDuty praktiziert und ist der Ansicht, dass eine solche Strategie eine Bewertung der Art und Weise umfassen sollte, wie die Teams Ihres Unternehmens ihre Dienste besitzen und betreiben. Besonders wichtig ist es, bei der Betrachtung neuer Technologien wie AIOps zu verstehen, wie diese in Ihre bestehenden Betriebsmodelle passen. Da Unternehmen zunehmend in die Cloud wechseln, um eine bessere Skalierbarkeit und Agilität zu erreichen, haben sich technische Organisationen weiterentwickelt, um immer mehr Anwendungen und Mikrodienste in zunehmend hybridisierten Umgebungen zu unterstützen.

Diese zunehmende Komplexität der gesamten Technologie bedeutet auch Veränderungen bei den Menschen und den entsprechenden Prozessen. Teams nehmen zunehmend eine dezentrale Form an, wobei Geschäftsbereiche oft ihre eigenen Technologieteams mit jeweils eigener Kultur, Geschwindigkeit und Toolchain beschäftigen. IT-Leiter, die AIOps-Lösungen kaufen möchten, sollten sicherstellen, dass sie sowohl zentralisierte als auch dezentrale Teams (bei denen Entwickler ihren Code in der Produktion einzeln besitzen und pflegen) im Auge behalten, um sicherzustellen, dass sie bei der Nutzung den richtigen Return on Investment erzielen.

Laden Sie diesen Bericht von 451 Research herunter um mehr über die Lektionen zu lesen, die Sie von Nancy Gohring lernen können, und wie PagerDuty AIOps Ihnen und Ihrem Unternehmen bei der Transformation zu DevOps und Full-Service-Eigentum helfen kann.