AIOps und Automatisierung: Ein Gespräch mit Gastredner Carlos Casanova, leitender Analyst bei Forrester
Anfang 2023 hatte ich ein tolles Gespräch mit Carlos Casanova , ein leitender Analyst bei Forrester, in einem kürzlichen Webinar darüber, wie AIOps dabei helfen kann, erfolgreiche organisatorische Veränderungen voranzutreiben. Laut unserem Gespräch hat Carlos den AIOps-Markt in zwei Lager unterteilt: technologiezentriert (vor allem APM/Observability-Akteure) und prozesszentriert. PagerDuty ist eine prozesszentrierte Lösung, die mehrere Technologien nutzt.
Mit prozessorientierten AIOps-Lösungen erhalten Unternehmen zusätzlichen Kontext und Einblicke in ihre Daten. Dies verkürzt die Reaktionszeit, trägt zur Verbesserung der Datenqualität bei, erleichtert die Entscheidungsfindung, verbessert die Routing- und Benachrichtigungseffizienz und steigert letztlich den Wert der von der IT bereitgestellten Dienste.
Diese Möglichkeit, die Geschwindigkeit durch mehr Kontext zu erhöhen, verkürzt die Zeit für kritische Vorfälle. Wichtig zu beachten ist, dass die anfängliche Weiterleitung an einen virtuellen Operator erfolgen kann. Dies bedeutet, dass die Automatisierung zusätzliche Triage-/Debug-Informationen liefern oder möglicherweise eine Korrektur durchführen könnte, bevor ein menschlicher Helfer eingeschaltet wird.
Während unseres Gesprächs kamen Carlos und ich immer wieder auf das Thema zurück, einen besseren Kontext für die Einsatzkräfte zu schaffen. Als ich ihn fragte, welche Fähigkeiten er für die Lösung zentraler AIOps-Anwendungsfälle als am wichtigsten ansieht, sagte er: „ Durch die schnelle Identifizierung der Korrelation zwischen unterschiedlichen Warnmeldungen wird der Aufwand für einzelne Personen drastisch reduziert. Die Bereitstellung dieses sauberen Datensignals für alle betroffenen Personen ist für die Verbesserung der Betriebsabläufe von entscheidender Bedeutung. Mit diesen Daten können einzelne Personen einfacher und schneller Einblicke in das gewinnen, was in der Umgebung wirklich vor sich geht. Sie können dann schnell die richtigen Maßnahmen ergreifen, entscheiden, wer für eine schnellere Behebung einbezogen werden muss, und den erforderlichen Aufwand reduzieren, wodurch Zeit für andere Ereignisse und Warnmeldungen frei wird.
Aber Teams haben oft Schwierigkeiten, loszulegen. Wir waren uns einig, dass die Kosten des Wartens und Planens die Kosten des Startens und Iterierens wahrscheinlich nicht wert sind. Er fügte hinzu: „Die Gesamtinitiative mag entmutigend aussehen, aber es gibt erreichbare schnelle Erfolge. Warten ist nicht zu empfehlen. Beginnen Sie mit kleinen taktischen Anstrengungen, die sich auf Ihre größeren und längerfristigen strategischen Ziele auswirken, um Fortschritte zu zeigen, Wert zu demonstrieren und Dynamik aufzubauen.“
Geschwindigkeit ist also ein Dauerthema: schnell Kontext zu erhalten, schnell mit Automatisierung zu reagieren und den Prozess sofort zu starten, um diese Erfolge zu erzielen. Aber wir wissen auch, dass der Druck weiter zugenommen hat.
Die Teams sind vom wirtschaftlichen Abschwung und der Rezession betroffen. Als ich ihn fragte, wie Teams ihre Effizienz steigern und ihren Erfolg messen können, sprachen wir darüber, dass Automatisierung der Schlüssel zum Erfolg ist.
Carlos antwortete: „Einfache Szenarien, die häufig auftreten, eignen sich hervorragend für die Automatisierung ihrer Behebung ganz oder teilweise. Die vollständige oder sogar teilweise Automatisierung von fünf oder zehn einfachen Szenarien gibt Einzelpersonen sofort viel Zeit, um sich auf die komplexeren Szenarien zu konzentrieren, die Organisationen möglicherweise nicht gerne automatisieren.“
Aber wir müssen auch erkennen, Forming, Storming und Norming bevor wir mit der Durchführung von Projekten beginnen. Es wird Veränderungen in der Art und Weise geben, wie wir Erfolg messen und darüber denken, die wir akzeptieren müssen.
„AIOps kann die IT auch in die Lage versetzen, Arbeitslasten zu verringern, damit ihre Lieferteams ‚mehr mit weniger erreichen‘ können. Es ist wichtig, sich daran zu erinnern, dass diese Änderungen bestehende Kennzahlen ungültig machen. Sie müssen neue Baselines festlegen, da einzelne Personen die einfachen und einfachen Aktionen nicht mehr ausführen werden. Ein Techniker löst beispielsweise 300 Vorfälle pro Woche manuell. Dreißig davon sind einfach und lassen sich leicht automatisieren. Die MTTR für diese könnte um 90 % sinken. Durch die Eliminierung der einfachen Vorfälle kann der Techniker jedoch nur 10 Vorfälle mittlerer Komplexität an ihrer Stelle übernehmen. Das bedeutet, dass der Techniker 20 Vorfälle weniger pro Woche bearbeiten wird. Die durchschnittliche MTTR für den Techniker wird steigen und Vorfälle werden länger in seiner Warteschlange bleiben, wobei der Anteil mittel- und hochkomplexer Vorfälle höher ist“, sagte Carlos.
Eine der häufigsten Fragen, die mir gestellt wird, ist, wie man anfängt. Traditionell wird AIOps als eine potenziell jahrelange Initiative betrachtet. Es kann entmutigend sein, die Reise mit so viel Unsicherheit und Veränderungen zu beginnen. PagerDuty hat den Prozess erheblich vereinfacht, indem es einen Ein-Klick-Prozess für die Ereigniskorrelation entwickelt hat, sodass Teams sofort den Wert erkennen können, aber dies ist nicht das Ende der Reise zu AIOps.
Carlos teilte seine Erkenntnisse zum Einstieg sowie zur Bewältigung der Reduzierung der verfügbaren Betriebskosten. „Budgets sind immer eine Herausforderung, aber Sie können diese Hürde weitgehend überwinden, indem Sie den Wert von AIOps demonstrieren und klar artikulieren. Entwickeln Sie eine Erzählung für Ihren Business Case, die den Wert verbesserter Erfahrungen mit der Organisation anspricht. Zeigen Sie, wie verbessertes Routing und Benachrichtigungen mit verbesserten kontextrelevanten Daten es derselben Belegschaft ermöglichen, mehr Arbeitslasten mit weniger Aufwand zu bewältigen. Erklären Sie, wie Muster und Trends Ressourcen auf niedrigerer Ebene befähigen, fortgeschrittenere Aktionen auszuführen, weil ihnen vorgeschlagene Aktionen bereitgestellt werden, die auf den erfahreneren und älteren Mitarbeitern basieren. All dies hilft Organisationen, die wirtschaftlichen Herausforderungen zu bewältigen, mit denen sie derzeit konfrontiert sind, und gleichzeitig die Qualität der von ihnen gelieferten Produkte und Dienstleistungen zu verbessern. Für Organisationen ist es wichtig zu zeigen, dass ihre gewählte Lösung eine schnelle Wertschöpfung ermöglicht. Um beispielsweise die Benutzererfahrung zu verbessern: Wie schnell kann die Lösung dem Supportpersonal vollständige Visualisierungen von Transaktionen bereitstellen, um einen Ausfall zu beheben? Um eine schnellere Reaktionszeit zu gewährleisten, muss die Lösung die Umgebung analysieren und neue Warnmeldungen zu einzelnen Vorfällen korrelieren, die sofort oder automatisch bearbeitet werden können. In wirtschaftlich schwierigen Zeiten ist die Time-to-Value von entscheidender Bedeutung.“
Für viele unserer Kunden kann die Zeit bis zur Wertschöpfung sogar noch wichtiger sein als der ROI. Geschwindigkeit ist das, was auf digitalen Schlachtfeldern Gewinner und Verlierer unterscheidet. Wie schnell wir mit unvermeidlichen Problemen umgehen und Verbesserungen iterieren können, ist das, was Teams von der Konkurrenz abhebt und ein hervorragendes Kundenerlebnis bietet.
Da I&O-Führungskräfte in Zeiten wirtschaftlicher Unsicherheit gezwungen sind, Kosten zu senken und mit weniger mehr zu erreichen, benötigen sie neue Tools und Ansätze, die ihnen helfen, ihre vorhandenen Ressourcen zu skalieren und zu optimieren. AIOps bietet Teams eine zuverlässige Möglichkeit, große Daten- und Ereignismengen zu verarbeiten, Routing und Antworten in Echtzeit zu verwalten und Teams dabei zu helfen, Vorfälle schneller zu lösen. Wenn Sie erfahren möchten, wie Sie diese Herausforderungen für Ihr Unternehmen bewältigen können, Sehen Sie sich dieses Webinar an um den Rest meines Gesprächs mit Carlos zu hören.