Der Blog

Vorabversion der neuen „Multi-Incident“-Version von PagerDuty

von Alex Solomon 18. März 2010 | 5 Minuten Lesezeit

Wir haben Ihre Funktionswünsche sorgfältig geprüft, um herauszufinden, wie wir PagerDuty am besten verbessern können. Ein Funktionswunsch kam dabei weitaus häufiger vor als alle anderen: die Integration von PagerDuty in Überwachungstools zu vereinfachen. Wir haben uns diesen Wunsch zu Herzen genommen und mit der Überarbeitung von PagerDuty begonnen, sodass wir bald die API-Integration mit Überwachungssystemen wie Nagios unterstützen können.

Bevor wir jedoch eine API für PagerDuty veröffentlichen können, müssen wir einige Vereinfachungen im Design von PagerDuty korrigieren. Bisher erforderte PD, dass Sie für jede Art von Problem, das Ihre Überwachungssysteme erkennen können, einen neuen Alarm erstellen. Leider funktioniert dies nicht so gut, wenn Sie ein Überwachungstool wie Nagios verwenden, das Tausende von Bedingungen gleichzeitig verfolgen kann.

In den letzten Wochen haben wir PD so umgestaltet, dass es mehrere offene Vorfälle von einem einzigen Überwachungsdienst aus verarbeiten kann. Wir sind kurz davor, diese neue und verbesserte Version von PagerDuty einzuführen. Zuvor möchten wir Ihnen jedoch die Möglichkeit geben, sich mit dem System vertraut zu machen und uns mitzuteilen, ob es Möglichkeiten gibt, das neue System vor der Einführung noch weiter zu verbessern.

Wie probiere ich es aus?

Gute Frage! In der nächsten Woche werden wir eine Vorschau des neuen PagerDuty Systems zeigen. Um sich anzumelden, besuchen Sie:

http://<your-subdomain> .pd-staging.com

und verwenden Sie Ihre normale PagerDuty E-Mail und Ihr Passwort.

Alle Ihre Daten wurden von Ihrem PagerDuty -Konto migriert, sodass Sie genau sehen können, wie das System aussehen wird, sobald wir die Software auf unseren Produktionsservern aktualisiert haben. Die Vorschauversion ist voll funktionsfähig, Sie können sie also gerne ausprobieren und ein paar Benachrichtigungen für Sie versenden lassen. Keine Sorge – nichts, was Sie in Ihrem Vorschaukonto tun, hat Auswirkungen auf Ihre Produktionsumgebung. Selbstverständlich sind alle SMS und Telefonanrufe aus der Vorschauumgebung kostenlos.

Um die Abwärtskompatibilität aufrechtzuerhalten, haben wir alle vorhandenen Alarme so konfiguriert, dass sie nur einen aktiven Vorfall gleichzeitig unterstützen. Um diese Einschränkung zu entfernen, gehen Sie einfach wie folgt vor:

  1. Klicken Sie auf die Registerkarte „Dienste“
  2. Wählen Sie einen Ihrer vorhandenen Alarme aus
  3. Klicken Sie auf der rechten Seite des Bildschirms auf „Diesen Dienst bearbeiten“
  4. Ändern Sie den Vorfallerstellungsmodus in „Für jede Trigger-E-Mail einen neuen Vorfall öffnen“.
  5. Klicken Sie auf „Änderungen speichern“

service_email_incident_creation2

Die große Veränderung: Multi-Incident-Support

PagerDuty ist jetzt in der Lage, mehrere gleichzeitig auftretende Vorfälle zu verfolgen. Anders ausgedrückt: Ihr Überwachungssystem kann PagerDuty über 100 gleichzeitig auftretende und unabhängige Probleme informieren, ohne dass Sie 100 PagerDuty -Alarme erstellen müssen, wie dies derzeit der Fall ist.

PagerDuty verwendet jetzt „Vorfälle“ statt „Alarme“ als Hauptobjekt. Ihr Supportteam wird Vorfälle bestätigen, eskalieren und lösen, statt der Alarme, mit denen es jetzt arbeitet. Vorfälle in PagerDuty ähneln Tickets in einem Fehlerverfolgungssystem: Sie werden erstellt, wenn ein Problem erkannt wird, und gelöst oder geschlossen, wenn das Problem behoben ist.

Da PagerDuty jetzt Hunderte von offenen Vorfällen gleichzeitig verarbeiten kann, haben wir versucht, die Benutzeroberfläche von PagerDuty sorgfältig zu gestalten, damit die Arbeit mit großen Vorfallsammlungen einfach ist. Die neuen Registerkarten „Vorfälle“ und „Dashboard“ enthalten Tabellen, in denen Sie alle Ihnen zugewiesenen offenen Vorfälle auf einen Blick sehen können. Sie können Ihre Vorfälle auch ganz einfach direkt von diesen Seiten aus mithilfe der Steuerelemente oben in der Tabelle sortieren.

incidents_tab2

Einer der größten Vorteile des bestehenden Einzelvorfalldesigns von PagerDuty besteht darin, dass es keine Alarmstürme auslösen kann. Selbst wenn Nagios Hunderte von E-Mails gleichzeitig an PagerDuty sendet, erhalten Sie nur einen Satz Telefonanrufe und SMS-Nachrichten. Wir haben darauf geachtet, diese Funktion in der neuen Version des Produkts beizubehalten. PagerDuty bündelt mehrere Vorfälle auf intelligente Weise in einem einzigen Satz von Benachrichtigungen, sodass Sie nicht mit Alarmen überhäuft werden.

Weitere Änderungen

Wir haben einige weitere kleine Änderungen vorgenommen, um die neue Multi-Incident-Funktionalität zu unterstützen.

Erstens haben wir „Alarme“ in „Dienste“ umbenannt. Alarme/Dienste werden jetzt nur verwendet, um einen Integrationspunkt zwischen PagerDuty und Ihren Überwachungsdiensten darzustellen. Derzeit verfügt PagerDuty nur über einen Diensttyp: den einfachen, per E-Mail ausgelösten Mechanismus, den Sie in der vorherigen Version von PagerDuty verwendet haben. In den kommenden Wochen werden wir Unterstützung für API-gesteuerte Dienste hinzufügen, damit wir eine noch engere Integration mit Produkten wie Nagios anbieten können.

Aus ähnlichen Gründen haben wir „Alarmgruppen“ in „Eskalationsrichtlinien“ umbenannt. Wir sind der Meinung, dass der neue Name die Verwendung dieser Objekte besser beschreibt.

Schließlich haben wir die Vorfallunterdrückung in „Bestätigen“ umbenannt. Wie zuvor wird diese Funktion verwendet, um vorübergehend zu verhindern, dass ein Vorfall Warnmeldungen generiert. Wir dachten, das Wort „Bestätigen“ beschreibt den Zweck der Funktion besser: „Hören Sie jetzt auf, mich mit diesem Problem zu belästigen … ich arbeite daran!“.

Was kommt als nächstes

Als Nächstes folgt die Unterstützung für eine PagerDuty -API. Sobald wir PagerDuty Multi-Incident in der Produktion eingesetzt und sichergestellt haben, dass alle mit dem neuen System vertraut sind, werden wir unsere Pläne für die API bekannt geben. Bleiben Sie dran für weitere Informationen!