- PagerDuty /
- Der Blog /
- ITOps und moderne Ops /
- Vorfallmanagement für ITOps-Teams: Lernen, zu zentralisieren
Der Blog
Vorfallmanagement für ITOps-Teams: Lernen, zu zentralisieren
Kann ITOps Teams zentralisieren das Vorfallmanagement? Wenn Sie im ITOps-Bereich arbeiten, lautet Ihre erste Antwort auf diese Frage möglicherweise ein klares „Nein“.
Schließlich umfasst das Aufgabenspektrum von ITOps so viele verschiedene Bereiche, dass es fast unmöglich erscheint, sie alle unter einen Hut zu bringen, wenn es um das Vorfallmanagement geht. Von der Serveradministration über die Bereitstellung von Desktop-PCs bis hin zum Helpdesk-Support – ganz zu schweigen von Dingen wie der Abwicklung von Einkäufen und der Verwaltung unabhängiger Auftragnehmer – ITOps-Teams erledigen alles.
Damit unterscheidet sich ITOps deutlich von den meisten anderen Bereichen einer Organisation. Wenn Sie eine Programmierabteilung sind, können Sie Ihre Entwicklungs- und Fehlerverwaltungsprozesse mithilfe eines Code-Repositorys zentralisieren. Wenn Sie im Vertrieb tätig sind, können Sie Produkte und Kundenkontakte über eine zentrale Plattform wie Salesforce verwalten. Bei ITOps ist das nicht der Fall, da es so viele verschiedene Aufgaben abdeckt.
Wir möchten Ihnen sagen, dass ein zentralisiertes Vorfallmanagement für ITOps kein Wunschtraum bleiben muss. ITOps übernimmt so viele verschiedene Aufgaben, dass es keine einheitliche Plattform für die Überwachung und Reaktion auf Probleme gibt. Sie können jedoch trotzdem die Art und Weise zentralisieren, wie Sie Vorfälle in Ihrer gesamten Infrastruktur verwalten.
Und wie machen Sie das? Indem Sie ein Vorfallmanagement-Tool verwenden, das sich in alle verschiedenen Stränge Ihres ITOps-Workflows integrieren lässt.
Optimale Nutzung Ihrer Überwachungsdienste
Lassen Sie uns anhand eines einfachen Beispiels durchgehen, wie Ihr ITOps-Team das Vorfallmanagement zentralisieren kann – auch wenn ITOps selbst nicht so zentralisiert ist.
Wenn Sie ein ITOps-Experte in einem kleinen oder mittleren Unternehmen sind, müssen Sie wahrscheinlich drei Haupttypen von Infrastruktur im Auge behalten. Der erste Teil sind Ihre lokalen Server, die Sie möglicherweise zum Hosten einer lokalen Dateifreigabe oder zum Bereitstellen einiger Websites verwenden. Der zweite Teil ist Ihre öffentliche Cloud, in der Sie Datensicherungen aufbewahren. Der dritte Teil sind lokale Arbeitsstationen, die am Laufen gehalten und mit Ihren lokalen und Cloud-Servern verbunden werden müssen.
Die Planung des Vorfallmanagements für jeden Teil dieser Infrastruktur ist schwierig. Einige Überwachungssysteme behaupten vielleicht, Bare-Metal-Server, Cloud-Infrastrukturen und PCs gleichermaßen gut unterstützen zu können. Aber wenn das der Fall ist, sind sie wahrscheinlich auf keinen dieser Bereiche spezialisiert. Sie bieten Ihnen nur eine allgemeine Überwachung ohne erweiterte Funktionen, die für bestimmte Arten von Infrastrukturen entwickelt wurden.
Aus diesem Grund ist es besser, eine Kombination aus Überwachungsdiensten zu verwenden, die auf die verschiedenen Teile Ihrer Infrastruktur zugeschnitten sind. Für Ihre Cloud werden Sie wahrscheinlich den größten Nutzen aus einem Cloud-zentrierten Überwachungssystem ziehen, wie AWS CloudWatch . SolarWinds könnte für Ihre lokalen Geräte und Ihr lokales Netzwerk nützlich sein. Und Sie möchten vielleicht etwas wie Splunk um alle Protokolldaten zu analysieren, die Ihre vielen Geräte ausspucken.
Ein Tool für das Vorfallmanagement, das alle Probleme löst
Jede der erwähnten Überwachungsplattformen verfügt über eine Art Warn- oder Benachrichtigungssystem, aber die Benachrichtigungen sind möglicherweise nicht so robust, wie Sie es benötigen. Selbst wenn dies der Fall ist, möchte kein ITOps-Team gleichzeitig Warnmeldungen von mehreren verschiedenen Plattformen erhalten – in unterschiedlichen Formaten und mit unterschiedlichen Inhaltstypen. Unter diesen Bedingungen wäre es äußerst schwierig sicherzustellen, dass die richtigen Warnmeldungen die richtigen Personen zur richtigen Zeit erreichen.
Die gute Nachricht für ITOps-Experten ist, dass das Vorfallmanagement nicht so verwirrend und unorganisiert sein muss. Selbst wenn Sie mehrere Überwachungssysteme für die verschiedenen Teile Ihres Betriebs im Einsatz haben, können Sie den Empfang aller Warnmeldungen zentralisieren.
Genauso wichtig ist, dass Sie auch die Verteilung der Benachrichtigungen an Ihr Team zentralisieren können. Einige Ihrer Überwachungsdienste können beispielsweise möglicherweise keine SMS-Benachrichtigungen versenden. Wenn Sie diese Dienste mit einer zentralisierten Vorfallmanagementplattform verbinden, die Benachrichtigungen in das von Ihnen benötigte Format übersetzen kann, können Sie sie bei Bedarf an die Telefone Ihrer Administratoren weiterleiten.
Und nicht zuletzt können Sie mit einer zentralisierten Vorfallmanagementlösung auch redundante Warnmeldungen vermeiden. Wenn Ihr Netzwerk überlastet ist, kann dies nicht nur zu Benachrichtigungen des Dienstes führen, der Ihre Netzwerk-Switches überwacht, sondern auch zu Benachrichtigungen des Überwachungsstapels auf Ihren Servern, der eine fehlerhafte Verbindung erkennt.
Wenn Sie mehrere Warnmeldungen erhalten, die auf dasselbe Kernproblem zurückzuführen sind, sorgt das für Verwirrung in Ihrem Team und verlängert die Reaktionszeit. Im Gegensatz dazu stellt ein zentralisiertes Vorfallmanagement sicher, dass das Team Benachrichtigungen für jeden einzelnen Vorfall erhält und nicht für jedes Überwachungssystem. So gibt es weniger Lärm und es ist sofort klar, was los ist.
Normalerweise scheint das Hinzufügen eines weiteren Tools zu Ihrem ITOps-Workflow nur zu einer Aufblähung zu führen. Das mag in vielen Kontexten zutreffen. Aber im Fall des Vorfallmanagements ist die Implementierung einer Lösung, wie PagerDuty, Durch die Zentralisierung von Benachrichtigungen kann Ihr ITOps-Team den Nutzen der bereits vorhandenen Überwachungstools deutlich steigern.