DevOps-Monitoring ist eine Multitool-Angelegenheit
Monitoring-Tools sollen das Leben erleichtern für DevOps Team und die Wahl des richtigen DevOps-Überwachungstools können den entscheidenden Unterschied für effiziente Arbeitsabläufe und zufriedenere Endbenutzer ausmachen.
DevOps-Monitoring-Tools gibt es in allen Größen und Formen
Zum üblichen Überwachungs-Toolkit der meisten DevOps-Teams gehören (unter anderem):
- ein Tool zur Infrastrukturüberwachung
- ein Tool zur Anwendungsleistungsüberwachung (APM)
- ein Tool zur Protokollanalyse
Lassen Sie uns tiefer in die einzelnen Ebenen eintauchen und sehen, wo sie in Ihren DevOps-Überwachungsprozess passen.
Infrastruktur- und Netzwerküberwachung
Diese Tools können die gesamte Infrastruktur und das gesamte Netzwerk überwachen, einschließlich Server, Router und Switches. Tools zur Infrastrukturüberwachung helfen dabei, Probleme mit der IT-Infrastruktur zu identifizieren und zu lösen, bevor sie kritische Geschäftsprozesse beeinträchtigen. Sie können Ihnen dabei helfen, Upgrades zu planen, bevor veraltete Systeme Ausfälle verursachen. Tools zur Infrastruktur- und Netzwerküberwachung stellen außerdem sicher, dass Wartungsausfälle nur minimale Auswirkungen auf die Benutzer haben.
Durch die Überwachung der Integrität der Infrastruktur können Sie sich ein Bild vom Zustand der darauf ausgeführten Anwendungen machen. Diese Tools überwachen die Anwendung jedoch nicht als vollständigen Satz von Diensten. In diesem Sinne verfolgen sie einen traditionellen Überwachungsansatz, der für die heutigen Cloud-Anwendungen nicht optimal geeignet ist.
Beispiel: Nagios , Zabbix
Überwachung der Anwendungsleistung
Tools zur Überwachung der Anwendungsleistung überwachen, wie der Name schon sagt, die Leistung Ihrer Anwendung. Sie bieten Einblick in das Verhalten Ihrer Anwendung, erkennen Probleme, die sich auf Benutzer auswirken, und helfen dabei, diese Probleme schnell zu beheben. Sie überwachen den Anwendungsfluss von Anfang bis Ende und bieten Traces, die Details auf Codeebene enthalten. APM-Tools enthalten umfassende Diagnosefunktionen, mit denen Sie die genaue Codezeile finden können, die möglicherweise eine Leistungsverlangsamung oder einen Leistungsausfall verursacht.
APM-Tools helfen zwar, die Leistung zu verbessern und Latenzen und Ausfallzeiten zu vermeiden, es gibt jedoch viele Probleme, die eine gründlichere Fehlerbehebung erfordern, als APM leisten kann. Diese Probleme erfordern die Indizierung und Suche in Protokolldateien. Leider analysieren APM-Tools keine Protokolldateien und können keine Sicherheitsangriffe erkennen. Für diese Art der Analyse benötigen Sie ein Protokollanalysetool.
Beispiel: Neues Relikt , AppDynamics
Protokollanalyse
Protokollanalysetools bieten eine skalierbare, zuverlässige Möglichkeit, Ihre Protokolldateien zu speichern und zu indizieren. Sie können Dateien schnell durchsuchen, detaillierte Analysen auf der Grundlage der Protokolldaten erstellen und auf der Grundlage der Protokolldatei auf Sicherheitsverletzungen und Cyberangriffe überwachen. Sie bieten jedoch keine End-to-End-Überwachung der Anwendungsleistung und können keine Spuren auf Codeebene aufdecken.
Beispiel: Splunk , Elastischer Stapel
Keines dieser Tools ist für eine End-to-End-Überwachung gedacht. Wenn Sie sich bei einem Vorfall nur auf eines dieser Tools verlassen, fehlt Ihnen immer ein Schlüsselelement für die Lösung.
Überwachungstools erfordern noch mehr Überwachung
Selbst wenn Sie alle diese Tools zur Überwachung eingesetzt haben, kann es chaotisch werden, wenn ein Vorfall eintritt. Die Warnungen all dieser Tools liefern viele sich überschneidende Daten. Das bedeutet, dass Sie hektisch herumsuchen und zwischen den Tools hin- und herspringen, was sowohl bei Ihren Teams als auch bei Ihren Kunden für viel Frust sorgt. Ihre MTTRs werden länger sein, da Sie mit einer Datenüberlastung aus Ihrem gesamten Toolset konfrontiert sind. Was Sie brauchen, ist eine Vereinfachung Ihrer Überwachung durch Vorfallmanagement.
Sie benötigen eine Plattform für das Vorfallmanagement
ES , und insbesondere DevOps-Teams, haben schon lange akzeptiert, dass die Überwachung eine Kombination aus erstklassigen Tools erfordert, die eng miteinander integriert sind. Bei all diesen Überwachungstools, die manchmal widersprüchliche Informationen und eine überwältigende Menge an Warnungen liefern, benötigen Sie einen zentralen Hub, um sie alle zu verwalten und eine Zusammenfassung des vorliegenden Vorfalls bereitzustellen. Eine Vorfallmanagementplattform wie PagerDuty ist entscheidend, um während eines Vorfalls Ordnung in das Chaos zu bringen.
Tools zur Vorfallsverwaltung heben das Signal aus dem Rauschen heraus, indem sie Warnungen mit niedriger Priorität unterdrücken und Warnungen mit hoher Priorität zur richtigen Zeit an die richtigen Personen weiterleiten. Da sie sich nahtlos in praktisch jedes andere Überwachungssystem integrieren lassen, bieten Ihnen Tools zur Vorfallsverwaltung die echte End-to-End-Überwachung, die jedes DevOps-Team benötigt. Mit ausgereiften Benachrichtigungsoptionen ermöglichen Vorfallsverwaltungslösungen wie PagerDuty Ihrem Team, auszuwählen, wie es benachrichtigt werden möchte. Darüber hinaus können diese Prozesse automatisiert werden, wodurch Ihr Team viel Zeit spart und die Gesamt-MTTR reduziert wird.
Alle Ihre Überwachungstools bieten ihre eigenen einzigartigen Funktionen, die jedoch bei unsachgemäßer Verwaltung für viel Verwirrung sorgen. Auch wenn Sie möglicherweise nie ein universelles Überwachungstool für DevOps haben werden, können Sie der Perfektion schon ziemlich nahe kommen, wenn Sie alle Ihre Überwachungstools von einem Ort aus verwalten und die empfangenen Daten mit einer Plattform wie PagerDuty filtern können.