Der Blog

PagerDuty Operations Cloud – Einführung im Herbst 2023

von Inga Weizman 30. Oktober 2023 | 8 min Lesezeit

In der gesamten Geschäftswelt wurde 2023 als das „Jahr der Effizienz“ bezeichnet. Unternehmen mussten mehr Wachstum und Innovation liefern, allerdings mit knapperen Budgets und weniger Personal als in den Vorjahren. CIOs mussten Strategien entwickeln, um das Risiko von Betriebsausfällen zu mindern und das Kundenerlebnis ihrer Marke zu schützen. Diese Kräfte haben viele Unternehmen dazu veranlasst, auf KI und Automatisierung zurückzugreifen, um die Produktivität im großen Maßstab zu steigern, da die Fähigkeit, auf moderne und effiziente Weise zu arbeiten, zu einem Wettbewerbsvorteil geworden ist.

Um unseren Kunden zu helfen, diesen Vorsprung zu erlangen, PagerDuty startet Neue Eigenschaften über den PagerDuty Operations Cloud die Betriebsabläufe und kritische, ungeplante Arbeiten rationalisieren – alles mit Hilfe von KI Und Automatisierung . Diese neuen Funktionen in den Bereichen AIOps, Incident Response und Process Automaton ermöglichen unseren Kunden ein schnelleres Wachstum, niedrigere Kosten und mehr Kundenvertrauen.

Und im Sinne der Effizienz ermöglichen wir unseren Kunden, ihre Tools und Datensätze zu konsolidieren, während sie ihre Reise der digitalen Transformation fortsetzen. Wenn Unternehmen effizient arbeiten – sei es ein Tech-Stack, ein Prozessablauf oder ein Budget – können sie die Gewinne ihres Unternehmens schützen. Und Befähigen Sie Ihre DevOps- und SRE-Teams, sich auf die strategischste, innovativste und erfüllendste Arbeit zu konzentrieren, die möglich ist.

Lassen Sie uns einen genaueren Blick auf diese neuen Ankündigungen werfen und sehen, wie sie für unsere Kunden funktionieren.

Steigern Sie die Produktivität und Innovation Ihres Teams mit KI

Jetzt ist es an der Zeit, in AIOps zu investieren. AIOps: Zunehmende Akzeptanz und Best Practices Bericht IDC prognostiziert, dass „bis 2026 90 % der CIOs großer Unternehmen AIOps-Lösungen nutzen werden, um automatisierte Entscheidungen zur Behebung und Verteilung von Arbeitslasten zu treffen, die Kosten- und Leistungsmetriken berücksichtigen und die Belastbarkeit sowie Agilität verbessern.“ Durch die Nutzung der innovativen KI- und AIOps-Funktionen von PagerDuty können Teams die Gesamtunterbrechungen um 87 % reduzieren und so ihren Tag konzentrierter und produktiver gestalten. Das bedeutet, dass Unternehmen schneller agieren, mehr unternehmensweite Automatisierung aufbauen und Lernprozesse beschleunigen können – und das alles mit der bestehenden oder reduzierten Mitarbeiterzahl.

Der Lärm von Warnmeldungen kann äußerst störend sein. Globale Alarmgruppierung hilft zentralisierten IT-Teams – wie NOCs und SREs –, den Lärm über alle Services hinweg weiter zu reduzieren, indem Warnmeldungen auf der Grundlage benutzerdefinierter Regelsätze gruppiert werden. Dadurch können die Teams den Umfang des Vorfalls besser verstehen, was zu schnelleren Lösungen und weniger Ausfallzeiten führt und mehr Zeit für Innovationen schafft.

Obwohl viele Organisationen wissen, dass Automatisierung ein Muss ist, wissen nicht alle, wie sie damit beginnen sollen. KI-generierte Runbooks (öffentliche Beta) helfen, schnell mehr Automatisierung für optimierte Betriebsabläufe aufzubauen. Durch die Verwendung der Verarbeitung natürlicher Sprache (NLP) werden textbasierte Eingabeaufforderungen in Automatisierungsskripte umgewandelt, damit Sie loslegen und schneller mehr Automatisierung aufbauen können. Dies demokratisiert die Automatisierungserstellung im gesamten Unternehmen für IT-Betrieb, SRE und Plattformentwicklungsteams und hilft weniger erfahrenen Benutzern.

Doch die Verbesserungen enden nicht mit der Lösung eines Vorfalls, denn die erfahrensten Teams lernen kontinuierlich dazu und passen sich an. KI-generierte Vorfall-Postmortems (EA) helfen, Zeit zu sparen und die Mühe von Post-Mortem-Analysen zu reduzieren. KI-generierte Zusammenfassungen erstellen einen umfassenden Bericht darüber, was wann passiert ist, wie es gelöst wurde und welche Maßnahmen für das nächste Mal ergriffen werden müssen. Diese neue Funktion sammelt und ordnet automatisch vollständige Vorfalldaten, sodass sich DevOps- und SRE-Teams auf die Erkenntnisse konzentrieren können, anstatt zeitaufwändig alle Vorfalldaten aus Protokollen, Slack und Tickets kopieren und einfügen zu müssen.

Bei Vorfällen ist es wichtig, die Beteiligten auf dem Laufenden zu halten, aber es kostet Zeit und Ressourcen. In manchen Organisationen sind mehrere Personen ausschließlich damit beschäftigt, die Beteiligten bei großen Vorfällen auf dem Laufenden zu halten. KI-generierte Status-Updates (EA) ermöglichen Teams, mit nur wenigen Klicks Statusaktualisierungen zu erstellen, sodass interne Stakeholder und Führungskräfte leichter auf dem Laufenden gehalten werden können. Durch die Nutzung generativer KI für Statusaktualisierungen können Sie die Anzahl der für Aktualisierungen zuständigen Personen reduzieren, Kosten senken und Zeit für Ihr Team freisetzen. Und sowohl KI-generierte Vorfall-Postmortems als auch Statusaktualisierungen helfen Ihren DevOps- und SRE-Teams, die Einführung bewährter Methoden in allen Diensten zu implementieren und konsequent aufrechtzuerhalten.

Skalieren Sie die Betriebseffizienz mit ereignisgesteuerter Automatisierung, um intelligente Fehlerbehebung auszulösen

CIOs suchen ständig nach Möglichkeiten, ihre Betriebsabläufe im Namen der Effizienz zu optimieren. Die Frage ist nicht mehr, wann, sondern wie Sie die Automatisierung im gesamten Unternehmen nutzen können. Laut Gartner „werden bis 2027 75 % der Unternehmen ihre isolierten Automatisierungsinitiativen kombinieren, um den Gesamtwert zu steigern. Dies ist ein deutlicher Anstieg gegenüber weniger als 10 % im Jahr 2022.“ Unternehmen automatisieren ihre Betriebsabläufe immer häufiger, damit sie schneller agieren und Zugriff auf relevante, in Echtzeit verwertbare Daten haben, die ihnen eine bessere Entscheidungsfindung ermöglichen. Angesichts der Datenmengen, die Unternehmen verarbeiten, ist es für Menschen nicht mehr effizient oder möglich, diese manuell zu durchforsten. Sie benötigen die Leistungsfähigkeit der Automatisierung, um Probleme schneller und mit wenig oder gar keinem menschlichen Eingriff zu lösen. Wenn Menschen beteiligt sind, müssen sie mit relevanten Daten ausgestattet werden, die ihnen helfen, Probleme schneller zu lösen.

Die Reaktion auf Vorfälle muss hochgradig koordiniert, kollaborativ und standardisiert erfolgen. Bei der Bewältigung eines kritischen Problems bleibt keine Zeit, nach Personen, historischen Daten oder Informationen zu suchen. Event-Orchestrierungsvariablen (EA) ermöglicht SRE-Teams den Aufbau intelligenter Automatisierung, die andere Tools und Prozesse für eine schnellere, gezieltere Reaktion auf Vorfälle unterstützt, die unternehmensweit standardisiert werden kann, um die Zusammenarbeit zwischen den Teams zu verbessern.

Vorfälle sind nicht immer einzigartig oder ungewöhnlich; tatsächlich sind viele von ihnen von Natur aus ähnlich und überschneiden sich hinsichtlich der Erkenntnisse und des relevanten institutionellen Wissens. PagerDuty Runbook-Automatisierung ermöglicht es PagerDuty AIOps und menschlichen Helfern, Automatisierung für die Diagnose und Behebung gut verstandener Vorfälle auszulösen. Die Nutzung der Synergien des Runbook Automation Add-On und von AIOps hilft lösen Sie Vorfälle bis zu 95 % schneller durch die Automatisierung sich wiederholender Aufgaben, wodurch die Zeit der Spezialisten frei wird und SREs, Plattformingenieure und Unternehmensarchitekten sich auf komplexere Vorfälle konzentrieren können. Das Runbook Automation Add-On unterstützt auch Automatisierungsanwendungsfälle für DevOps, ITSM, Self-Service-IT und ereignisgesteuerte Automatisierung. Dies hilft Kunden Reduzieren Sie geplante Ausfallzeiten um bis zu 85 % Und Supportkosten um bis zu 55 % .

Bauen Ausfallsicherheit mit einer Plattform, die zu Ihrer Arbeitsweise passt

Die unbequeme Wahrheit ist, „Alles geht ständig schief.“ Vorfälle werden passieren. Indem Sie diese Realität anerkennen und sich darauf vorbereiten, können Sie das Risiko und die Schwere der Auswirkungen auf Ihre Kunden und Ihre Teams verringern. Mithilfe von Online-Umsatzdaten, Gremlin berechnet, dass eine einzige Minute Ausfallzeit für eine Top-E-Commerce-Site 200.000 US-Dollar oder mehr an entgangenen Einnahmen kosten kann. Hier hört die Verantwortung auf, wenn man die negativen Auswirkungen auf die Marke berücksichtigt, sind die zukünftigen Gesamtkosten viel, viel höher. Unternehmen, die Wege finden, die Auswirkungen von Ausfallzeiten zu reduzieren, werden letztendlich einen Wettbewerbsvorteil erlangen, indem sie das Kundenerlebnis weiterhin aufrechterhalten und verbessern. Mit dieser neuesten Reihe von Verbesserungen und Funktionen helfen wir unseren Kunden, Kosten zu sparen und mehr Wert und mehr Effizienz aus ihren Tools zu ziehen. Mit der zusätzlichen Flexibilität und Anpassung können Kunden Betriebsprozesse besser entsprechend ihren Anforderungen optimieren.

Heutzutage verarbeiten Unternehmen mehr Daten als je zuvor, deren Verwaltung aufgrund ihrer Verteilung auf verschiedene Tools und Systeme eine Herausforderung sein kann. Das Extrahieren und Konsolidieren dieser Daten kann ein arbeitsintensiver Prozess sein. Deshalb bietet PagerDuty Analytics eine praktische, sofort einsatzbereite Analyse-Dashboard (EA) und geplant Analytics-E-Mails (eingeschränkte Kundenvorschau) , wodurch Einblick in die Leistung jeder Kennzahl im Zeitverlauf und erstklassige Benchmarks gewonnen werden, die eine bessere Befragung ermöglichen und bei der Planung für größere Vorfälle helfen. Sie liefern optimierte Leistungskennzahlen und Daten an die richtigen Stakeholder, um ihnen zu helfen, die Betriebseffizienz in ihren Teams kontinuierlich zu verbessern. Kunden, die PagerDuty Analytics nutzen, konnten ihre mittlere Zeit bis zur Bestätigung (MTTA) um 28 % verbessern sowie eine gerechtere Arbeitsverteilung und konsistentere Reaktionszeiten erzielen, was einer Einsparung von 100 Arbeitsstunden pro Jahr und Team entspricht.

Teams in DevOps, der zentralen IT oder SRE benötigen mehr Flexibilität bei der Anpassung ihrer Tools – und müssen gleichzeitig sicherstellen, dass sie, wann immer möglich, Best Practices verwenden, während sie ihre Betriebsabläufe kontinuierlich verfeinern. Verbesserungen beim Vorfall-Workflow ermöglichen Organisationen die Anpassung ihrer Workflows und stellen Vorlagen bereit, die auf branchenweit bewährten Methoden basieren, um schnell loslegen zu können. Durch die Reduzierung manueller Schritte durch die automatische Auslösung von Diagnose- und Behebungsprozessen mithilfe der Runbook-Automatisierung tragen Incident-Workflows zur Beschleunigung der Lösung bei und verringern die Arbeitsbelastung der Incident-Responder

Globale, verteilte Teams müssen bei Vorfällen effizient zusammenarbeiten. Mit Slack/Chat als Kontaktmethode (EA) können Sie schnell ein Einsatzteam mobilisieren, ohne den Kontext zu wechseln oder auf SMS angewiesen zu sein, die langsam, unzuverlässig und teuer sein können. Diese neue Funktion bedeutet Kosteneinsparungen für globale Teams, die WLAN nutzen können, anstatt sich auf den Mobilfunkempfang zu verlassen. Außerdem spart sie Zeit und ermöglicht es Teams, präziser und auf die gewünschte Weise zusammenzuarbeiten und zu kommunizieren.

Wir haben auch unsere Partnerschaft mit Google Cloud erweitert und sind ein zentraler Integrationspartner In Personalisierte Service Health-Integration von Google Cloud. Es sendet proaktive, angepasste und detaillierte Warnmeldungen zu Störungen des Google-Dienstes, um Problemen vorzubeugen, die sich auf die Kunden auswirken. Die Partnerschaft zwischen PagerDuty und Google Cloud bietet eine wichtige Plattform für effiziente Cloud-Operationen, die Kunden dabei unterstützt, auf Störungen zu reagieren und reibungslose digitale Erlebnisse zu gewährleisten.

Beginnen Sie mit diesen neuen Funktionen

Die PagerDuty Operations Cloud hilft unseren Kunden, kritische Betriebsabläufe mithilfe leistungsstarker KI und Automatisierung neu zu definieren, sodass sie Kosten sparen, schneller Innovationen hervorbringen, ihre Belastbarkeit erhöhen und ihre Belegschaft skalieren können. Diese neueste Version der PagerDuty -Plattform bietet mehr Flexibilität bei der Arbeit, um das Versprechen von weniger Vorfällen und einer verbesserten mittleren Zeit bis zur Lösung (MTTR) einzuhalten.

Erfahren Sie mehr über all diese neuen spannenden Funktionen und melden Sie sich an für Früher Zugang zu unseren GenAI-Fähigkeiten.