Zuverlässigkeit

Ankündigungen , Gemeinschaft , Zuverlässigkeit

Das Kundensupport- und Advocacy-Team von PagerDuty gewinnt den Stevie® Award

Wir freuen uns, bekannt geben zu können, dass unser Kundensupport- und Advocacy-Team bei den International Business Awards 2015 den Silver Stevie® Award in der Kategorie „Kundenserviceabteilung des Jahres“ gewonnen hat. Die Auszeichnung unterstreicht PagerDutys Engagement für seine Kunden, wie eine Zufriedenheitsbewertung von durchschnittlich 98,3 Prozent im Jahr 2014 zeigt.

3 Minuten Lesezeit

Alarmierung , Gemeinschaft , Betriebsleistung , Zuverlässigkeit

Die Entdeckung des Poison Packet von Apache ZooKeeper

ZooKeeper ist für diejenigen, die es noch nicht wissen: Es handelt sich um ein bekanntes Open-Source-Projekt, das eine äußerst zuverlässige verteilte Koordination ermöglicht. Viele Menschen auf der ganzen Welt vertrauen darauf, darunter auch PagerDuty. Es bietet hohe Verfügbarkeit und Linearisierbarkeit durch das Konzept eines Leaders, der dynamisch wiedergewählt werden kann, und gewährleistet Konsistenz durch ein Mehrheitsquorum. Die Mechanismen zur Leader-Wahl und Fehlererkennung sind ziemlich ausgereift und funktionieren normalerweise einfach ... bis sie es nicht mehr tun. Wie kann das sein? Nun, nach einer langwierigen Untersuchung gelang es uns, vier verschiedene Bugs aufzudecken, die sich zusammenschlossen, um uns zu belästigen, was zu zufälligen clusterweiten Abstürzen führte. Zwei dieser Bugs lagen in ZooKeeper, und die anderen beiden lauerten im Linux-Kernel. Das ist unsere Geschichte.

15 Minuten Lesezeit

Merkmale , Leben auf Abruf , Zuverlässigkeit

PagerDuty führt Team-Organisationsfunktion ein

Egal in welchem ​​Team Sie sind, PagerDuty hilft Ihnen, Vorfälle schneller zu lösen. DevOps beinhaltet die Zusammenarbeit mehrerer Teams für bessere Zuverlässigkeit und Qualitätssicherung. Ein zentrales, gemeinsam genutztes Tool wie PagerDuty zur Verwaltung von Vorfällen im gesamten Unternehmen macht diese Zusammenarbeit um einiges einfacher. Unsere neue Funktion zur Teamorganisation macht es für verschiedene Teams wie Betrieb, Entwicklung und Kundensupport noch einfacher, zusammenzuarbeiten. So geht's

2 Minuten Lesezeit

Alarmierung , Best Practices und Einblicke , Zuverlässigkeit

Best Practices in der Störungskommunikation: Kunden

Ausfälle sind chaotisch und es kann schwierig sein, den besten Weg zu finden, Ihre Kunden über das Problem zu informieren. Eine der ersten großen Entscheidungen, die Sie treffen müssen, ist, ob Sie nur auf Personen reagieren, die sich nach dem Problem erkundigen, oder ob Sie proaktiver vorgehen und Updates öffentlich posten möchten. Viele der führenden Technologieunternehmen haben begonnen, Ausfälle offen mit ihren Kunden zu besprechen, und es gibt eine Reihe guter geschäftlicher Gründe dafür. Unabhängig von Ihrem Ansatz sind hier 6 Dinge, die Sie tun können, um eine erfolgreiche Kundenkommunikation während Ausfällen sicherzustellen.

8 min Lesezeit