Der Blog

Ein genauerer Blick auf die neuen AIOps-Funktionen von PagerDuty

von Ariel Russo 29. September 2020 | 7 min Lesezeit

Ein anderer PagerDuty Gipfel ist in den Büchern, und wir sind immer noch ganz aufgeregt wegen der Begeisterung und Energie, die uns unsere Kunden und die Community in der letzten Woche entgegengebracht haben. Wir haben im Laufe der Konferenz mehrere große Ankündigungen gemacht, aber keine war so bedeutend wie die AIOps-Fortschritte auf unserer digitalen Betriebsplattform.

Wir haben eine Reihe von Möglichkeiten vorgestellt, wie Kunden Algorithmen und Automatisierung des maschinellen Lernens auf eine breite Palette von Arbeitsabläufen auf der gesamten Plattform anwenden können. Von der Rauschunterdrückung und Ursachenanalyse bis hin zur automatischen Behebung und erweiterten Analyse zielt unsere Version darauf ab, die Effizienz von IT-Teams durch den Einsatz von AIOps zu steigern, um Komplexität und menschliche Arbeitskraft zu reduzieren – und das in einer Zeit, in der Unternehmen versuchen, mehr zu erreichen, ohne zusätzliche Ressourcen bereitzustellen.

PagerDuty zielt außerdem darauf ab, die Ermüdung zu verringern, die bei der Verwaltung zunehmend komplexer IT-Umgebungen unweigerlich auftritt – eine Ermüdung, die durch die globale Pandemie noch verstärkt wurde. AIOps ist der Schlüssel zur Bestimmung der Beziehung zwischen den Tausenden von Warnmeldungen, die alle Elemente einer IT-Umgebung heute generieren können. Ziel ist es, IT-Teams mehr Kontext und verwertbare Informationen bereitzustellen.

Um mehr über AIOps als Anwendungsfallkategorie und deren Definition zu erfahren, lesen Sie unbedingt diese Blogs:

 

Lassen Sie uns nun in die Details der neuesten AIOps-Funktionen von PagerDuty eintauchen.

Detaillierte Einblicke in Innovationen

Intelligente Empfehlungen

Nichts ist wichtiger als die Gesundheit und geistige Gesundheit Ihres Teams. Doch in der heutigen schnelllebigen und komplizierten IT-Landschaft können Umwelteinflüsse diesem Imperativ entgegenwirken, indem sie Müdigkeit und Burnout verursachen. Intelligent Recommendations nutzen maschinelles Lernen, um Maßnahmen vorzuschlagen, um Reduzieren Sie Lärm und verbessern Sie die Teameffizienz und Gesundheit und liefert gleichzeitig die prognostizierten ROI-Ergebnisse aus der Umsetzung der vorgeschriebenen Maßnahmen.

  • Empfehlungen zur Lärmreduzierung Identifizieren Sie automatisch Dienste, die unter Alarmrauschen leiden, diagnostizieren Sie die Ursache und geben Sie Einsatzkräften und Dienstbesitzern individuelle Empfehlungen zu Methoden, um unwichtiges Rauschen zu reduzieren. PagerDuty hat herausgefunden, dass Kunden durch die Umsetzung von Empfehlungen zur Rauschreduzierung im Durchschnitt bis zu 67 % weniger Alarme und Vorfälle verzeichnen können – das sind 67 % weniger Fehlalarme und unnötige Arbeit!
  • Gesundheitsempfehlungen des Teams. Teams müssen mehr denn je anstrengen, um die Online-Arbeit von Unternehmen aufrechtzuerhalten, aber übermüdete Helfer machen Fehler. Verbessern Sie die Gesundheit Ihrer Mitarbeiter und halten Sie Ihr Bereitschaftsteam frisch, indem Sie Arbeiten, die spät in der Nacht oder außerhalb der Arbeitszeiten anfallen, dem entsprechenden Team oder Manager melden und eine Empfehlung für die Schichtübernahme für den Helfer senden.

 

Kuratierte erweiterte Analyse und Reifegradmodellplanung

Unsere neuesten Erweiterungen basieren auf der umfassenden und leistungsstarken Analytics-API von PagerDuty , die unseren umfangreichen Datensatz für Kundenanfragen öffnet. Sie stellen unseren Benutzern die nützlichsten und am häufigsten verwendeten analytischen Erkenntnisse direkt in einer benutzerfreundlichen Oberfläche zur Verfügung. Sobald bestimmte Anfragen und Berichte identifiziert wurden, kann eine regelmäßige Planung von Berichten konfiguriert werden, um verschiedene Interessengruppen auf dem Laufenden zu halten.

  • PagerDuty Analyselabor extrahiert Erkenntnisse aus dem umfangreichen Datensatz von PagerDuty für personalisierte Analysen, um eine Vielzahl von Fragen zu beantworten (z. B.: Was hat der letzte Vorfall gekostet? Welche Vorfälle haben meine Lösungszeit beeinträchtigt?). Darüber hinaus haben wir unser Reifegradmodell und Benchmarkdaten von über 13.000 Kunden kodifiziert, um Benutzern dabei zu helfen, einzuschätzen, wo sich ihr Unternehmen auf seiner digitalen Reise befindet, und ihnen zu zeigen, wie sie ihren Reifegrad verbessern können, indem sie Optimierungsempfehlungen umsetzen.

Sie können die Berichterstellung automatisieren und Analysen über unsere Slack-Integration dort freigeben, wo Ihr Team arbeitet. Zu den verfügbaren Berichten gehören:

    • Kritische und schwerwiegendste Vorfälle
    • Serviceintegrität und -optimierung
    • Möglichkeiten zur betrieblichen Kosteneffizienz
    • Teamgesundheit und -optimierung
    • Analyse der geschäftlichen Auswirkungen

  • Analyse der Bereitschaft zur Rufbereitschaft hilft dabei, Teams richtig zusammenzustellen, damit sie ihren Bereitschaftspflichten erfolgreich nachkommen können. Verwenden Sie diesen Bericht, um Ihre Bereitschaftshaltung zu verbessern und Ihren Fortschritt in Richtung organisatorischer Bereitschaft zu verfolgen. Eine ordnungsgemäße Teamzusammenstellung kann die Lösungszeiten verkürzen und die Reaktionsfähigkeit Ihrer Organisation auf Vorfälle verbessern.
Dynamische Dienstabhängigkeiten

Der Schlüssel zum serviceorientierten Ansatz von PagerDuty ist, dass unser einzigartiges Serviceverzeichnis in Echtzeit aktuell und genau ist. Wir haben unser Serviceverzeichnis erheblich verbessert, indem wir die Erfassung und Aktualisierung von Abhängigkeitsinformationen optimiert haben. Jetzt können Sie Upstream- und Downstream-Abhängigkeiten automatisch anzeigen, um die Problemlösung zu beschleunigen, Doppelarbeit zu reduzieren und zukünftige Vorfälle zu verhindern. Wir haben außerdem die Aufgabe, Abhängigkeitsinformationen in Ihrem Serviceverzeichnis aktuell zu halten, mit Empfehlungen für maschinelles Lernen und bidirektionalen integrierten Servicedaten von wichtigen Partnern automatisiert, sodass Ihr Team von einer einzigen zuverlässigen Quelle aus arbeiten kann.

  • Benutzerdefinierte Abhängigkeiten können schnell in einer optimierten Schnittstelle abgebildet und definiert werden. Jetzt können Sie Abhängigkeiten und Beziehungen zwischen vor- und nachgelagerten technischen Services und Business Services mit geringem Wartungsaufwand verfolgen.
  • Automatisierte Abhängigkeitserkennung Funktionen schlagen relevante Abhängigkeiten durch maschinelles Lernen vor und heben sie direkt auf der Seite mit den Vorfalldetails hervor. Während der aktiven Vorfall-Triage helfen Ihnen diese Abhängigkeitsinformationen, Sackgassen zu vermeiden, schnell zusammenzuarbeiten und die richtigen Maßnahmen zur Lösung von Problemen zu ergreifen. PagerDuty hat mehrere Varianten dieser Funktionalität veröffentlicht, darunter:

  • ServiceNow-Integration v7 hilft Kunden, ihre Integration zu stärken und mehr Wert aus ihren Investitionen in ServiceNow und PagerDuty zu ziehen, indem neue, bidirektionale Funktionen genutzt werden, wie z. B. das Ausführen eines PagerDuty Reaktionsspiels in ServiceNow oder das Posten eines Handlungsaufrufs von ServiceNow auf der PagerDuty Vorfalldetailseite, um Benutzern Live-Statusaktualisierungen bereitzustellen. Darüber hinaus können sowohl geschäftliche als auch technische Serviceabhängigkeiten aus der CMDB von ServiceNow mit dem Serviceverzeichnis von PagerDuty geteilt werden, sodass Teams die Auswirkungen von Vorfällen besser verstehen und kritische Services identifizieren können.

Mapping der Auswirkungen von Änderungen

Schätzungsweise 80 % der Vorfälle werden durch Änderungen verursacht. Deshalb hat PagerDuty Änderungsereignisse aus dem Softwarebereitstellungsprozess vollständig integriert ( CI/CD Pipelines) und Code-Repositories, die die Sichtbarkeit von Änderungen ermöglichen, um deren Auswirkungen besser zu verstehen. Nutzen Sie diesen Echtzeitkontext, um sofort zu erkennen, wo Änderungen Fehler verursacht haben, und um vorherzusagen, welches Risiko zukünftige Änderungen für kritische Geschäftsdienste haben könnten.

  • Änderungsuntersuchung zur Lösung von Vorfällen verkürzt die Lösungszeiten durch DevOps Die Responder verstehen, welche Änderungen wahrscheinlich ein Problem verursacht oder dazu beigetragen haben. Sie können Kontextinformationen über aktuelle Software- oder Konfigurationsänderungen verwenden, um ein Problem zu diagnostizieren und möglicherweise eine Verschlimmerung zu verhindern, oder schnell die nächsten Schritte einleiten, um eine wirksame Reaktion zu koordinieren.
  • Integration von Änderungsereignissen mit GitHub , Marionette , Und Entwickeln Bieten Sie PagerDuty -Kunden eine einfachere Möglichkeit, Änderungsereignisse aus ihrer Softwarebereitstellungspipeline zu übernehmen.

Flexible Automatisierungssteuerung

Die Anwendung von KI und Automatisierung auf etwas so Wichtiges wie die digitalen Abläufe eines Unternehmens erfordert absolutes Vertrauen. Aus diesem Grund haben wir flexible Automatisierungskontrollen entwickelt, um sicherzustellen, dass ein Mensch jederzeit die Kontrolle hat. PagerDuty schlägt vor, wo Automatisierung hilfreich sein kann, und kann sicherstellen, dass kein Mensch unterbrochen wird, wenn dies nicht nötig ist, sondern benachrichtigt ihn bei Bedarf. Dies bietet Unternehmen eine vertrauenswürdige Möglichkeit, die Automatisierung im gesamten Unternehmen zu integrieren und zu beschleunigen. PagerDuty unterstreicht unser Engagement für benutzerfreundliche Automatisierung kündigte eine endgültige Vereinbarung an Rundeck zu übernehmen – einen führenden Anbieter von Runbook-Automatisierung für Unternehmen – um die automatische Behebung für Kunden zugänglicher zu machen, die ihre Incident-Response-Prozesse automatisieren möchten.

  • Pausierte Vorfallbenachrichtigungen Reduzieren Sie Betriebsgeräusche, indem Sie Auslöser verzögern und den Maschinen die Möglichkeit geben, automatisch Abhilfe zu schaffen, bevor sie die Einsatzkräfte benachrichtigen. Kunden können ein Prüfprotokoll der Auslöser und Aktionen führen, unabhängig davon, ob ein Einsatzkräfte benachrichtigt wurde.
  • Ereignisgesteuerte Webhooks Geben Sie Reaktionsteams die Möglichkeit, Vorfälle schneller und mit weniger Ressourcen zu lösen, indem Sie die Automatisierung per Knopfdruck mithilfe von Ereignisregeln nutzen, um externe Prozesse und Workflows auszulösen. Benutzer können auch den Status von Automatisierungssequenzen überwachen und verfolgen, die für einen Dienst ausgelöst wurden.
  • Dynamische Feldanreicherung und -extraktion hilft DevOps-Ingenieuren, Warnmeldungsinhalte so zu normalisieren, dass sie ihren individuellen terminologischen Formatierungsanforderungen entsprechen. Dies kann die Ergebnisse von Berichten und Analysen verbessern und hilft dabei, Hindernisse bei der Einführung ressourcensparender Funktionen wie intelligenter und inhaltsbasierter Warnmeldungsgruppierung zu beseitigen.

Wenn Ihr Team von einer dieser Verbesserungen profitieren könnte, schauen Sie sich unbedingt unsere Kostenlose Testphase oder Melden Sie sich an, um frühzeitigen Zugriff zu erhalten zu den neuen Funktionen.