• PagerDuty
    /
  • Der Blog
    /
  • Automatisierung
    /
  • PagerDuty führt auf der re:Invent 2022 eine automatisierte Diagnose für AWS ein, mit der Unternehmen Vorfälle schneller beheben und so innovativer gestalten können

Der Blog

PagerDuty führt auf der re:Invent 2022 eine automatisierte Diagnose für AWS ein, mit der Unternehmen Vorfälle schneller beheben und so innovativer gestalten können

von Inga Weizman 28. November 2022 | 7 min Lesezeit

Es ist wieder soweit! PagerDuty kommt für AWS re: Invent 2022 zurück in die Sündenstadt! Die globale Konferenz bringt Organisationen aller Größen zusammen und beschäftigt sich mit den Themen Modernisierung, Automatisierung und Ausfallsicherheit in der Cloud. Angesichts der aktuellen wirtschaftlichen Lage wollen Unternehmen ihre Betriebsabläufe skalieren und Kosten optimieren und ihren Kunden gleichzeitig ständig verfügbare digitale Erlebnisse bieten. Automatisierung spielt eine Schlüsselrolle bei der Unterstützung der Betriebs- und Kosteneffizienz. Dieses Jahr freuen wir uns, eine neue Lösung auf der re:Invent-Etage mitzubringen: Automatisierte Diagnose für AWS Dadurch bleibt den Entwicklungsteams mehr Zeit für Innovationen und es gibt weniger Unterbrechungen. Wir sind außerdem stolz darauf, Platin-Sponsor bei re:Invent zu sein, unsere langfristige Beziehung zu AWS zu vertiefen und unseren gemeinsamen Kunden automatisierte CloudOps bereitzustellen.

Die Cloud frisst die Welt

Laut Gartner „werden bis 2023 40 % aller Unternehmens-Workloads in Cloud-Infrastrukturen und Plattformdiensten bereitgestellt, was einer Steigerung von 20 % im Vergleich zu 2020 entspricht.“ Dieses Zitat unterstreicht die Tatsache, dass die Einführung der Cloud weiterhin oberste Priorität für Unternehmen hat, die ihre Dienste und Backend-Infrastruktur weiter digitalisieren möchten. AWS bietet Ihnen beispiellose Skalierbarkeit, Agilität und Innovationsgeschwindigkeit, aber die Teams sehen sich mit zunehmender Komplexität und immer stärkeren Abhängigkeiten zwischen Systemen, Prozessen und ihren Organisationen konfrontiert. Diese komplexe Situation droht das Kunden- und Mitarbeitererlebnis – ganz zu schweigen vom Umsatz – zu gefährden.

Wenn Unternehmen in die Cloud migrieren und Cloud-native Architekturen einsetzen, kann die zunehmende Komplexität zu mehr (kostspieligen) Vorfällen führen. Viele Unternehmen arbeiten in komplexen Cloud-Architekturen mit mehreren miteinander verbundenen Diensten – viele davon nur flüchtig –, die über verschiedene Verfügbarkeitszonen und Konten hinweg eingesetzt werden. Wenn Vorfälle auftreten, kann es lange dauern, sie zu beheben, ohne die Grundursache zu verstehen oder zu wissen, wer über die entsprechenden Zugriffsrechte und Fachkenntnisse verfügt. Dies bedeutet viele Eskalationen und Entwickler, die von wichtiger Arbeit abgezogen werden.

Vorfälle können teuer werden — Wirklich teuer. Ein großer Einzelhändler kann verlieren über 200.000 $ pro Minute Umsatz pro Minute, in der die Website nicht erreichbar ist. Vorfälle verursachen auch Produktivitätskosten, da die Ingenieure an der Behebung des Problems arbeiten, anstatt neue Funktionen zu entwickeln und sich auf Innovationen zu konzentrieren. Eine schlechte Kundenerfahrung aufgrund oder während eines Vorfalls kann ein Unternehmen zusätzlich Geld in Form von Markenreputation kosten. Und wenn Sie all diese Faktoren zusammenzählen, sind die Kosten eines Vorfalls viel höher, als Sie vielleicht einkalkuliert haben.

Resilienz ist wichtig

Ausfallsicherheit ist unerlässlich, um sicherzustellen, dass Ihre Kunden ihre digitalen Erlebnisse mit wenig oder gar keinen Unterbrechungen genießen können. Die unangenehme Realität? Dinge werden zwangsläufig kaputtgehen und Dienste ausfallen. Das passiert uns allen. Was wirklich zählt, ist, wie schnell Sie sich erholen und Ihre Dienste wieder in den grünen Bereich bringen können, und außerdem sicherzustellen, dass ähnliche Vorfälle wie dieser in Zukunft nicht wieder auftreten. Um die Kontinuität Ihres Geschäfts und aller Ihrer Dienste sicherzustellen, müssen Sie vollständige Transparenz über Ihre hybride Infrastruktur haben und sicherstellen, dass Sie Probleme schnell erkennen und diagnostizieren können.

Resilienz entsteht nicht von selbst, sondern ist eine gemeinsame Verantwortung. Kunden müssen ihre Infrastruktur, Abläufe und Mitarbeiter so einrichten, dass sie Vorfälle überstehen und schnell darauf reagieren können. Die Definition klarer Eigentums- und Verantwortlichkeitsverhältnisse, indem Teams ihre Dienste entwickeln und besitzen, ist ein wesentlicher Bestandteil, um sicherzustellen, dass Sie gezielt und in Echtzeit auf Vorfälle reagieren können.

PagerDuty unterstützt Teams mit End-to-End-Vorfallreaktion und erweiterten Automatisierungsfunktionen, die jedes Mal schnell und präzise die richtige Reaktion orchestrieren. Die Prozessautomatisierung hilft Teams dabei, Vorfälle schnell zu diagnostizieren und zu lösen, indem sie die Anzahl der Eskalationen und die MTTR deutlich reduziert, sodass sich die Entwicklungsteams auf kontinuierliche Verbesserung und Innovation konzentrieren können.

Zu viele Menschen, zu wenig Zeit

Moderne Cloud-Architekturen für AWS-Kunden setzen sich aus rund 250 auf dem Markt verfügbaren AWS-Diensten und 25.000 SaaS-Workflows zusammen, kombiniert mit selbst entwickelter Software und anderen Legacy-Systemen.

Wenn in diesen komplexen Cloud-Umgebungen Vorfälle auftreten, ist häufig der Zugriff auf umfassende Cloud-Stack-Expertise erforderlich, um die wahrscheinliche Grundursache zu ermitteln, andere Möglichkeiten in Abhängigkeiten auszuschließen und nach Fehlalarmen zu suchen. Dies kann erfordern, dass ein Ersthelfer mehrere Experten anweist, diese Diagnosen zu sammeln und zu bestimmen, wer letztendlich das Problem lösen sollte.

Ersthelfern fehlt oft das Know-how und der Zugriff, um Diagnoseinhalte in AWS-Umgebungen zu sammeln. Viele Ersthelfer sind Generalisten und verfügen nicht über das technische Wissen darüber, welche Untersuchungen zur Diagnose spezifischer Probleme in Diensten erforderlich sind. Ersthelfern fehlt aufgrund von Sicherheitsrichtlinien auch der Superuser-Zugriff, um technische Untersuchungen durchführen zu können.

Dies bedeutet, dass Ersthelfer normalerweise mehrere Experten hinzuziehen müssen, um die Daten zu erhalten, die sie zur Einstufung eines Vorfalls benötigen. Dies kostet mehr Zeit des Personals, den Vorfall zu beheben, und unterbricht mehr Teammitglieder. Bei schwerwiegenden Ausfällen verlängert dies unnötig die Zeit, die zur Behebung eines Vorfalls benötigt wird, hält Ingenieure von wichtiger Arbeit ab und erhöht die Gesamtkosten eines Ausfalls. Automatisierung kann eine Schlüsselrolle spielen, um Vorfälle nicht nur schneller zu beheben, sondern auch Ersthelfer mit den Diagnosedaten auszustatten, die sie benötigen, um Vorfälle selbst zu beheben, wodurch wertvolle Ingenieurzeit gespart wird.

Automatisierte Diagnose für AWS

Mithilfe der automatisierten Diagnose für AWS können Incident-Responder die Vorfälle schnell selbst sortieren. Dadurch wird die Notwendigkeit einer Eskalation um Hilfe verringert, die Lösung für Kunden beschleunigt und die Betriebseffizienz gesteigert. Automatisierte Diagnose für AWS in PagerDuty bietet häufig verwendete, vorgefertigte Diagnosejobvorlagen für häufig verwendete Dienste, darunter Amazon EC2, AWS Lambda, Amazon ECS, Amazon RDS und mehr. Kunden können diese Jobvorlagen problemlos so konfigurieren, dass sie in ihren spezifischen Umgebungen funktionieren, und die Diagnoseschritte in einem Workflow erweitern. Automated Diagnostics für AWS ermöglicht es Kunden außerdem, schnell ihre eigenen Diagnosejobs für AWS zu entwerfen und Korrekturautomatisierungen zur Schadensbegrenzung und -behebung bereitzustellen, die von Respondern innerhalb von PagerDuty Incident Response aufgerufen oder von PagerDuty Event Intelligence ausgelöst werden können.

Kundenserviceteams und Stakeholder werden mit Statusinformationen in Echtzeit koordiniert, um ein besseres Kundenserviceerlebnis zu bieten. Die Automatisierung hilft internen Teams, effizienter zu arbeiten, indem sie die MTTR um 25 Minuten verkürzt, die Anzahl der zur Lösung eines Vorfalls erforderlichen Personen verringert und die Anzahl der Eskalationen um 40 % reduziert. Dies spart Zeit und Geld und verbessert gleichzeitig das Kundenerlebnis.

Screenshots of PagerDuty Incident Response

Automatisierte Diagnose für AWS:

  • Gibt Ersthelfern die Möglichkeit, Vorfälle zu priorisieren, einzudämmen und zu lösen, und verbessert so die MTTR auf ganzer Linie.
  • Reduziert Eskalationen an Ingenieure durch die Verwendung vorgefertigter Jobvorlagen und Plugin-Integrationen für wichtige AWS-Tools und -Dienste.
  • Ermöglicht Teams, die Effizienz der Reaktion auf Vorfälle in ihren AWS-Umgebungen kontinuierlich zu verbessern und gibt den Ingenieuren mehr Zeit

Erfahren Sie mehr über Automated Diagnostics für AWS oder Fang hier an .

Lernen Sie PagerDuty bei AWS re:Invent kennen

Es wird viele Gelegenheiten geben, unser Team bei re:Invent zu treffen, ein paar Werbegeschenke mitzunehmen, Pagey zu begrüßen und an Blitzvorträgen an unserem Stand teilzunehmen.

Besuchen Sie unsere Stand Nr. 3819 um eine Demo unserer Produktangebote zu erhalten, darunter Prozessautomatisierung, Incident Response, Event Intelligence und Kundenservice, um zu sehen, wie die PagerDuty Operations Cloud Ihnen helfen kann, Ihre digitalen Abläufe zu verbessern. Wir werden auch viele Lightning Talks von unseren Partnern haben – erfahren Sie mehr Hier .

Wenn Sie den Menschenmassen aus dem Weg gehen und ein Meeting oder eine Demo in einem unserer Konferenzräume planen möchten, senden Sie einfach Ihre hier anfragen . Unser Team kann das Gespräch auf Ihre spezifischen Bedürfnisse zuschneiden und Ihnen mehr über PagerDuty und AWS erzählen.

Montag, 28. November, 14:30 Uhr im Venetian Theatre, Ebene 2, Sitzung Nr. PRT217

Nehmen Sie an unserer Diskussionsrunde mit Branchenführern von SalesForce, Netflix, Sailpoint und Benefitfocus teil und diskutieren Sie, wie sie ihre Organisationen mit PagerDuty und AWS transformiert haben.

Speaker card for re:Invent panel featuring PagerDuty

Mittwoch, 30. November, 18:00-20:00 Uhr

Tritt unser ... bei Treffen Sie Führungskräfte und Ihre Branchenkollegen im Matteo's Ristorante Italiano zu abendlichen Cocktails und Gesprächen. Erfahren Sie mehr darüber, wie PagerDuty einigen der innovativsten Unternehmen der Welt hilft, ein überragendes Kundenerlebnis zu bieten.

Image of martini

Um mehr über PagerDuty und AWS zu erfahren klicken Sie hier oder betrachten dieses Webinar.