Triage PagerDuty Warnungen mit Loggly
Gast-Blogbeitrag von Jason Skowronki, Produktmanager bei Loggly . Loggly ist der weltweit beliebteste cloudbasierte Protokollverwaltungsdienst mit über 3.500 aktiven Kunden. Entwickler und Systemadministratoren beheben Probleme, überwachen den Systemstatus und gehen mit Warnmeldungen proaktiv auf Probleme ein.
Sie sind mit Freunden zum Abendessen ausgegangen und erhalten eine Benachrichtigung über PagerDuty. Ihre Anmelderate ist weit unter das übliche Niveau gefallen. Das könnte auf ein ernstes Problem mit Ihrer Site hinweisen, aber es könnte auch einfach ein ungewöhnliches Verkehrsmuster sein. Sollten Sie das Restaurant verlassen und nach Hause eilen? Oder würden Sie einfach wohlverdiente Ausfallzeit für etwas opfern, das bis morgen warten kann?
Warnmeldungen sind für die rund um die Uhr verfügbare, internetzentrierte Wirtschaft von entscheidender Bedeutung. Sie sind eine Möglichkeit, die Auswirkungen von Anwendungsproblemen auf Umsatz und Gewinn zu minimieren. Bei Loggly sind wir von PagerDuty begeistert, weil es uns mehr Vernunft bei der Erkennung von Betriebsproblemen, der Zuweisung der richtigen Ressourcen zur Lösung dieser Probleme und deren Verfolgung bis zum Abschluss gebracht hat. Es beantwortet die äußerst wichtigen „Wer“-Fragen und ist eine perfekte Ergänzung zum Loggly-Dienst, der DevOps-Teams die Möglichkeit bietet, sich mit dem „Warum“ zu befassen.
Triage und schnellere Ermittlung der Grundursache von Problemen
Kommen wir zurück zu unserer unterbrochenen Mahlzeit. PagerDuty teilt Ihnen mit, dass aufgrund eines unerwarteten Rückgangs der Anmeldungen ein Alarm ausgelöst wurde. Sie benötigen jedoch weitere Informationen darüber, von welchem System die Anmeldungen stammen und wer dafür verantwortlich ist. Sie klicken auf den Alarm und gelangen direkt zu Ihrem Loggly-Dashboard, wo Sie sehen, dass der Alarm genau zum selben Zeitpunkt ausgelöst wurde, als eine Bereitstellung stattfand. Dies ist also wahrscheinlich ein echtes Site-Problem. Zeit für die Überprüfung.
Während Sie warten, suchen Sie nach den Protokollen Ihrer Anmeldeseite. Sie sehen, dass Klicks aufgezeichnet werden, aber dass Anrufe nicht konsequent an den Back-End-Dienst gesendet werden. Später zeigt Ihnen ein Blick in den Code, dass die Seite in Internet Explorer-Browsern nicht richtig gerendert wird. Sie setzen die Bereitstellung zurück, melden dem Front-End-Team einen Fehler und beheben die PagerDuty Warnung.
Loggly bietet DevOps-Teams tiefere Einblicke in ihre Systeme, sowohl während der ersten Bewertung und Sichtung als auch während sie daran arbeiten, ihre Betriebsprobleme zu isolieren und zu lösen. Unsere leistungsstarke Such- und Filterfunktion, Point-and-Click-Diagrammerstellung und Dashboards helfen Ihnen, Unmengen von Protokolldaten aus Anwendungen, Plattformen und Systemen sofort zu verstehen. Sie können schnell Korrelationen zwischen einem Alarmzustand und anderen Dingen erkennen, die auf Ihren Systemen passieren, und Sie haben Zugriff auf alle Daten, die Sie benötigen, um die Grundursachen zu finden.
So müssen Sie Ihren Tag nicht mehr wegen kleinerer Probleme unterbrechen und können sich auf die großen konzentrieren. Und diese großen Probleme können Sie viel schneller lösen.
Hängen Sie heute Abend mit Loggly, New Relic und PagerDuty beim Empfang von DataBeat ab und trinken Sie ein paar Data-tinis auf unsere Kosten!