- PagerDuty /
- Der Blog /
- Alarmierung /
- Training zur intelligenten Alarmgruppierung
Der Blog
Training zur intelligenten Alarmgruppierung
Komplexe Vorfälle sind sowohl anstrengend als auch alltäglich. In diesem Fall sind die Vorfälle, die ich als „komplex“ bezeichne, Vorfälle, die mehrere, unterschiedliche Benachrichtigungen in Ihrer Alarmverwaltungsplattform beinhalten. Vielleicht sind diese Vorfälle logisch getrennt, weil die zugrunde liegenden Systeme oder Dienste als weniger gekoppelt angesehen wurden, als sie es in Wirklichkeit waren. Oder vielleicht hat das Verhalten, auf das die Benachrichtigungen aufmerksam machen, mehrere potenzielle Ursachen, was die Zuordnung der Vorfälle erschwert.
Unser Standardverhalten
Das Standardverhalten besteht darin, Titel zu gruppieren, die textlich ähnlich sind. Es ist wichtig zu verstehen, dass es einen Unterschied zwischen „textlich ähnlich“ und der Art und Weise gibt, wie unser Verstand gängige Arten von Warnungen logisch gruppieren könnte. Wenn Sie beispielsweise Nachrichten wie „Speichernutzung auf dem Host ist hoch (> 90 %)“ und „Speichernutzung auf dem Host ist hoch (> 95 %)“ würden diese wahrscheinlich gruppiert, da sie sich nur um ein „Wort“ unterscheiden (das hervorgehobene Perzentil). Nehmen wir andererseits an, Sie hätten Warnmeldungen, die lauten: „Speichernutzung hoch (>X%) auf Server $NAME in Region $REGION“. Diese Meldungen würden sich für uns ähnlich lesen, da sie einem Muster folgen, aber sie enthalten zu viele verschiedene und eindeutige Wörter, um erfolgreich von Intelligent Alert Grouping standardmäßig gruppiert zu werden. Im nächsten Beitrag werde ich ausführlich erläutern, wie man Titel erstellt, die Intelligent Alert Grouping standardmäßig einfacher und erfolgreicher erkennt – das Ziel dieses Absatzes ist lediglich, Ihnen zu helfen, Ihren Ausgangspunkt zu kennen.
Verbessern Sie die Genauigkeit durch Zusammenführen
Das Ziel der Standardeinstellung ist es, Ihnen einen Ausgangspunkt zu bieten. Wenn Sie Intelligent Alert Grouping regelmäßig verwenden, müssen Sie das Verhalten wahrscheinlich an Ihre eigenen Umgebungen anpassen. Denken Sie zunächst daran, dass maschinelles Lernen nur mit dem Titelfeld trainiert wird. In unserem nächsten Beitrag werde ich genauer beschreiben, wie Sie die Titelvergabe für Vorfälle für die Verwendung mit dieser Funktion verbessern können. Als Nächstes sollten Sie wissen, dass Intelligent Alert Grouping Zusammenführungen verwendet, um Muster entweder zu verstärken oder neu zu lernen. Um zu vermeiden, dass Muster zu aggressiv abgeglichen werden, ändert Intelligent Alert Grouping sein Verhalten nach 5-10 Zusammenführungen.
So führen Sie Vorfälle zusammen
Es gibt mehrere Möglichkeiten, Vorfälle zusammenzuführen. Eine davon ist, wenn Sie einen oder mehrere Vorfälle in der PagerDuty Benutzeroberfläche auswählen, wird die Schaltfläche „Vorfälle zusammenführen“ angezeigt.
Hier wird eine Liste aktiver Vorfälle angezeigt:
Ich habe das oberste Feld neben „Status“ ausgewählt, um alles zum Zusammenführen auszuwählen:
Sobald die Vorfälle ausgewählt sind, wird ein Dialogfeld angezeigt, in dem Sie auswählen können, mit welchem Vorfall Sie zusammenführen möchten. In diesem Fall habe ich den aktuellsten ausgewählt:
Der Übersichtlichkeit halber habe ich den Titel des Vorfalls geändert, um zu zeigen, dass die Vorfälle zusammengeführt wurden. Das Ergebnis sieht so aus:
Es ist wichtig zu wissen, dass beim Zusammenführen von Vorfällen der Vorfall auf oberster Ebene ungelöst bleibt und alle zusammengeführten Vorfälle gelöst werden. Dies sieht folgendermaßen aus:
Sie können Vorfälle auch zusammenführen, indem Sie den Vorfall öffnen und im Dropdown-Menü „Mehr“ die Option „Mit einem anderen Vorfall zusammenführen“ auswählen:
Wenn Sie diese Methode verwenden, werden Vorfälle nicht automatisch in einer Dropdown-Liste angezeigt. Sie müssen daher die Vorfallnummer kennen und auf „Vorfall suchen“ klicken:
Weitere Informationen zum Zusammenführen von Vorfällen finden Sie in unserem Support-Dokumentation zu diesem Thema . Beachten Sie bitte, dass Sie die Zusammenführung von Vorfällen derzeit nicht aufheben können. Gehen Sie beim Zusammenführen daher vorsichtig vor!
Wenn Warnungen getrennt werden müssen
Es kann vorkommen, dass Sie Warnungen von Vorfällen verschieben müssen, die entweder durch Gruppieren oder den oben beschriebenen manuellen Prozess falsch zusammengeführt wurden. Die wichtigste Einschränkung, die Sie hierbei beachten müssen, ist, dass Sie die Warnungen nicht zu ihren ursprünglichen Quellvorfällen zurückverschieben können. Der Grund dafür ist, dass Vorfälle beim Zusammenführen gelöst (geschlossen) werden und Sie Warnungen nicht in einen gelösten Vorfall verschieben können.
Stattdessen müssen Sie einen neuen Vorfall erstellen und die gewünschten Warnungen dorthin verschieben, da Sie Warnungen nicht in einen gelösten Vorfall verschieben können. Benutzer können manuell einen neuen Vorfall erstellen, indem sie die blaue Schaltfläche „Neuer Vorfall“ in der Benutzeroberfläche verwenden. Weitere Informationen dazu finden Sie in unserem Support-Dokumentation zum Erstellen/Verwalten von Vorfällen .
Wichtige Erkenntnisse und wie es weitergeht
Dieser Beitrag war viel! Was Sie sich merken müssen:
- Intelligent Alert Grouping verwendet das Vorfalltitelfeld, um zu bestimmen, welche Vorfälle gruppiert werden sollen
- Durch das Zusammenführen von Vorfällen, die gruppiert werden sollen, können Sie das Übereinstimmungsverhalten manuell ändern
- Es dauert 5-10 Zusammenführungen, bis die intelligente Alarmgruppierung beginnt, ihr Standardverhalten zu ändern
- Seien Sie beim Zusammenführen vorsichtig, da Sie Vorfälle nicht direkt wieder trennen können. Sie müssen einen neuen Vorfall erstellen und Warnungen nach Bedarf dorthin verschieben.
In diesem Beitrag habe ich erwähnt, dass die intelligente Alarmgruppierung das Titelfeld verwendet, um zu bestimmen, welche Vorfälle zusammengeführt oder getrennt werden. In unserem nächsten Beitrag erkläre ich, wie Sie dies beim Erstellen Ihrer Vorfalltitel nutzen können.
Alle Beiträge dieser Reihe verwenden das ei-architecture-series tag , schauen Sie unbedingt vorbei und lesen Sie auch die anderen Beiträge dieser Reihe.