Der Blog

Erster Tag des Gipfels: Bereitstellung neuer Machine-Learning-Funktionen zur Reduzierung von Kosten und Ausfällen

von Julian Dunn 24. September 2019 | 6 min Lesezeit

Bei PagerDuty entwickeln wir jeden Monat kontinuierlich Neuerungen (sehen Sie sich unsere Seite „Neuigkeiten“ für die neuesten Updates). Aber während wir kontinuierlich Produkte ausliefern, speichern wir auch eine Fülle neuer und verbesserter Funktionen, die wir mit unseren Kunden teilen können. PagerDuty Gipfel , unser jährliches Kundenevent.

In diesem Beitrag erläutern wir die neuen Funktionen, die heute beim Summit vorgestellt wurden, und wie sie Ihnen mehr Transparenz und Informationen bieten, damit Sie im richtigen Moment bessere Entscheidungen treffen und Ihre Betriebsleistung kontinuierlich verbessern können.

Warum das wichtig ist

In der heutigen Keynote fasste PagerDutys CEO Jennifer Tejada zusammen, wie sich das digitale Geschäft in den letzten 10 Jahren entwickelt hat – 2009 gab es beispielsweise 100.000 Apps im Apple App Store (im Vergleich zu über 2 Millionen heute) und die Cloud existierte kaum. Aber wie Jennifer betonte, hält das digitale Geschäft seine Versprechen nur dann, wenn es das Kundenerlebnis verbessert – und je mehr es wächst, desto schwieriger wird es für Technologieteams, dafür zu sorgen, dass alles reibungslos läuft.

Wenn Kunden beispielsweise aufgrund von Ausfällen oder Verlangsamungen eine schlechte Erfahrung machen, obwohl laut Dashboard alles „funktioniert“, ist dieses Dashboard nicht besonders wertvoll. Es wird immer wichtiger, technische Daten sowohl in Echtzeit (in den sogenannten Aktionsmomenten) als auch danach (in den sogenannten Reflexionsmomenten) mit Geschäftsergebnissen zu verknüpfen.

Wie machst Du das?

Um technische Daten erfolgreich mit Geschäftsergebnissen zu verknüpfen, benötigen Sie drei Dinge:

  • Sichtweite über sehr komplexe Systeme der Technologie und der Menschen
  • Intelligenz oder durchdachter Einsatz von Automatisierung und maschinellem Lernen
  • A Kultur von Echtzeit-Operationen, die nicht nur technische Teams, sondern Ihre gesamte Organisation durchdringen

Wenn Dinge schief laufen, Sichtweite hilft Organisationen dabei, schnell ein klares Verständnis darüber zu entwickeln, welche Systeme betroffen sind und wo die Probleme liegen könnten, aber auch darüber, wer an den Problemen arbeitet und welche Rollen sie dabei spielen – selbst wenn einige von ihnen keine technischen Fachleute sind. Schließlich kann eine schlechte Kundenerfahrung mit einem Systemausfall beginnen und eskalieren, weil die Kunden im Dunkeln gelassen werden, wenn die Kommunikationsteams nicht angemessen in die Reaktion auf den Ausfall eingebunden werden. Noch schlimmer ist es, wenn Ihr Unternehmen zu den 51 % der Unternehmen gehört, die routinemäßig zuerst von ihren Kunden von Ausfällen erfahren – ein Ergebnis von PagerDutys Bericht zum Stand ungeplanter Arbeiten 2019 .

Intelligenz bedeutet, modernste Innovationen in den Bereichen Automatisierung und maschinelles Lernen einzusetzen, um Störungen zu reduzieren, sodass Reaktionsteams die Auswirkungen und den Umfang von Problemen schnell einschätzen können. Anstatt Menschen durch Automatisierung ihre Arbeit zu verlieren, bedeutet ein durchdachter Einsatz von Automatisierung, sie bei ihrer Arbeit effektiver zu machen. Mit anderen Worten: Wir nutzen Intelligenz, um qualifizierten Mitarbeitern nützliche Erkenntnisse zu vermitteln und ihre Effektivität zu steigern.

Schließlich ist die Einrichtung einer Kultur und die Einstellung zu Echtzeitabläufen im gesamten Unternehmen sowie zu kontinuierlicher Verbesserung bedeutet, dass jeder im Unternehmen es als seine Aufgabe ansieht, den Kunden zu bedienen und ihm rund um die Uhr das beste Erlebnis zu bieten. Es ist nicht mehr nur die Verantwortung der IT, die Server am Laufen zu halten – stattdessen muss jeder seinen Teil dazu beitragen.

Unsere Ankündigungen

Heute geben wir zwei bedeutende Verbesserungen an unserem Ereignisintelligenz Und Analyse Produkte, die diese Themen widerspiegeln.

Als wir letztes Jahr Event Intelligence vorstellten, führten wir auch Intelligente Alarmgruppierung , das maschinelles Lernen verwendet, um Warnmeldungen zu gruppieren, sodass Teams nicht mehrere Warnmeldungen zu verwandten Problemen erhalten. Der nächste Schritt ist Intelligente Triage , eine neue Funktion, die Kontext zu einem Vorfall bietet, beispielsweise ob er schon einmal aufgetreten ist, wie er gelöst wurde, wie weit er verbreitet ist, welche Dienste betroffen sind, wer daran arbeitet und wie diese Personen erreicht werden können.

Indem PagerDuty seine Teams umgehend mit diesem Wissen ausstattet, hilft es Unternehmen, die richtigen Leute mit den richtigen Informationen zusammenzubringen, um Probleme schneller zu lösen, die Kosten von Ausfallzeiten zu minimieren und negative Kundenerlebnisse zu verhindern.

„IT-Organisationen werden von der ständig wachsenden Zahl von Vorfällen und Ereignissen überschwemmt, die von mehreren Plattformen generiert werden, und suchen nach besseren Tools, um diese Informationen zu verwalten und zu filtern, Aktivitäten zu priorisieren und Reaktionen zu definieren“, sagte James Governor, Analyst und Mitbegründer von RedMonk. „Infrastrukturautomatisierung ist der Schlüssel zum effektiven Betrieb von IT-Organisationen. PagerDuty entwickelt jetzt Tools zur Wissensautomatisierung, die es Teams ermöglichen, auf Vorfälle als Team statt als Einzelpersonen zu reagieren. Die interaktiven Team-Dashboards und die intelligente Alarmauflösung von PagerDuty sollen Teams effektiver machen, indem sie die kognitive Überlastung der Organisation reduzieren und gängige Reaktionen und Lösungen automatisieren.“

Intelligent Triage verwendet außerdem maschinelle Lerntechnologie, die anhand Ihrer Daten trainiert wird, um Rauschen weiter zu reduzieren und Beziehungen zwischen Ereignissen abzuleiten. Sie können dem Modell positive oder negative Verstärkung geben, indem Sie mit der Benutzeroberfläche interagieren, wie beispielsweise mit dem hier gezeigten Feedback-Mechanismus „Daumen hoch/Daumen runter“.

Intelligent Triage verwendet maschinelles Lernen, um andere damit verbundene Probleme vorzuschlagen, die möglicherweise gleichzeitig auftreten.

Intelligente Dashboards in PagerDuty Analytics ermöglichen die Erkundung Ihrer Betriebsdaten, ergänzt durch eine ML-gestützte Empfehlungs-Engine namens Spotlight, die Führungskräften ermöglicht, sofort Maßnahmen zu ergreifen. Da unsere Kunden mit vielen Analyselösungen zu kämpfen hatten, die Datenvisualisierungen, aber keine klaren Maßnahmen liefern, hielten wir es für entscheidend, nicht nur die Daten, sondern auch konkrete Empfehlungen auf der Grundlage der Datenwissenschaft bereitzustellen, denen digitale Führungskräfte folgen können. Wir haben auch gehört, wie wichtig es für Führungskräfte ist, zu wissen, wie ihre Teams im Vergleich zueinander und im Vergleich zu Branchenmaßstäben abschneiden, daher haben wir auch eine Benchmarking-Funktion integriert.

Intelligente Dashboards bieten präskriptive Einblicke in Ihre Betriebsdaten, kombiniert mit Empfehlungen für Maßnahmen, die Sie sofort ergreifen können.

Intelligente Dashboards bauen auf dem auf, was PagerDuty Analytics Anfang des Jahres eingeführt hat: moderne Metriken bereitgestellt durch Scorecards für operative Überprüfungen . Im Gegensatz zu Scorecards, die normalerweise für wöchentliche, monatliche oder vierteljährliche Geschäftsberichte verwendet werden, können Sie mit Intelligent Dashboards jederzeit umsetzbare Erkenntnisse aus Ihren Daten ableiten.

Erfahren Sie mehr

Intelligent Triage und Intelligent Dashboards sind nur einige der Innovationen, die wir heute hervorheben wollten – weitere Ankündigungen finden Sie auf unserer Seite „Neuigkeiten“ . Wenn Sie diese Woche beim PagerDuty Summit sind, besuchen Sie unseren PagerDuty Stand in der Expo Hall für eine Demo dieser und anderer Funktionen. Wenn Sie nicht am Summit teilnehmen können, stehen beide Funktionen ab Oktober als Vorschau für Kunden zur Verfügung. Wenden Sie sich also an Ihr PagerDuty -Accountteam, um eine Demo zu vereinbaren.