- PagerDuty /
- Der Blog /
- Innovation /
- 6 wichtige Schritte zur Reduzierung der Vorfalllösungszeit
Der Blog
6 wichtige Schritte zur Reduzierung der Vorfalllösungszeit
Wie lange dauert es, bis eine Lösung gefunden wird?
Die Zeit bis zur Lösung (TTR) oder mittlere Zeit bis zur Lösung (MTTR) bezieht sich auf die durchschnittliche Zeitspanne, die benötigt wird, um einen Kundendienstfall oder ein Ticket nach dessen Eröffnung zu lösen. Wenn sich ein Kunde oder Benutzer wegen eines Problems mit Ihrem Service an Ihr Team wendet, ist es wichtig, die MTTR zu minimieren, um das bestmögliche Erlebnis mit minimalen Ausfallzeiten zu gewährleisten. Nehmen wir beispielsweise an, ein Kunde ruft an, um ein Problem mit Ihrem Produkt zu melden. Die TTR-Uhr startet, sobald diese Interaktion stattfindet, und stoppt, sobald eine Lösung erreicht wurde. Je kürzer die Lösungszeit, desto zufriedener der Kunde.
Die TTR kann für verschiedene Mitarbeiter und verschiedene Vorfallkategorien berechnet werden, um Trends sowie mögliche Verbesserungsbereiche aufzuzeigen. Das Ziel sollte immer sein, die zur Lösung eines Problems benötigte Zeit zu minimieren, damit Kunden Ihren Service mit so wenig Unterbrechungen wie möglich ordnungsgemäß nutzen können.
„Wie können wir die Zeit zur Problemlösung verkürzen? Unsere MTTR-Zahlen ziehen uns nach unten!“
Wenn Sie diese Frage in den Himmel schreien, sind Sie nicht allein. Es handelt sich um ein chronisches Supportproblem. Wie können Sie die Zeit zur Lösung von Vorfällen verkürzen? Wie sich herausstellt, gibt es einige sehr effektive und sinnvolle Dinge, die Sie tun können. Wir werden sie uns in diesem Beitrag ansehen.
Metriken, Metriken, Metriken
Zuallererst ist es wichtig, zu verstehen, wie Metriken zur Beurteilung der Vorfalllösung verwendet werden, und zu entscheiden, welche Aspekte dieser Metriken für Sie am wichtigsten sind.
Die grundlegendste Kennzahl für die Lösungszeit ist natürlich MTTR (mittlere Zeit bis zur Lösung) . Es ist eine dieser Kennzahlen, die das obere Management gerne mag, weil sie alles in einer schönen, einfachen Zahl zusammenfasst. Leider ist es auch eine dieser Zahlen, die sich als zu Einfach, wichtige Informationen werden herausgefiltert und es bleibt nur ein nahezu bedeutungsloser Durchschnitt übrig.
Die Gesamt-MTTR (die die Reaktion auf alle Vorfälle abdeckt) ist ein zuverlässiger Messwert, wenn die Daten nicht von zu vielen Ausreißern beeinflusst werden und wenn sie auf einem breiten Spektrum von Vorfällen basieren, die gut in eine glockenförmige Kurve passen. Wenn es jedoch zwei unterschiedliche Vorfallssätze gibt, die zwei verschiedene Arten von Problemen mit sehr unterschiedlichen Lösungszeiten darstellen, kann die MTTR irreführend sein. Da breite, glockenförmige Kurven oft anomale Ausreißer enthalten, ist die systemweite Gesamt-MTTR möglicherweise überhaupt kein guter Messwert.
Wenn Sie bei den Kennzahlen die Wahl haben, welche Alternativen gibt es zur Gesamt-MTTR? Hier sind einige Empfehlungen:
- Separate MTTRs für jede Vorfallklasse: Wenn Sie bestimmte Vorfallklassen definieren können, können Sie für jede Klasse separate MTTRs verwenden. Dies kann sehr hilfreich sein, wenn sich die betreffenden Vorfälle auf natürliche Weise in unterschiedliche Klassen unterteilen lassen. Erliegen Sie jedoch nicht der Versuchung, Vorfallklassen künstlich zu entwickeln, nur damit Sie beim nächsten Meeting gute MTTR-Zahlen vorweisen können.
- Prozentsatz gelöster Fälle: Sie können sich auch den Prozentsatz der innerhalb einer Zielzeit gelösten Probleme oder den Prozentsatz der nach Ablauf einer festgelegten Frist nicht gelösten Probleme ansehen. So können Sie die Lösungszeit mit einem Ziel vergleichen und die Vorgehensweisen beim Vorfallmanagement anpassen, um dieses Ziel zu erreichen.
- Gesamtzahl der Vorfälle und kumulative Vorfallzeit: Damit die Zahlen MTTR oder Ziellösungszeit jedoch Sinn ergeben, müssen Sie die Gesamtzahl der Vorfälle und die kumulierte Vorfallzeit für einen bestimmten Zeitraum berücksichtigen. Warum? Werfen wir einen Blick auf Tabelle A unten. Sie haben zwei verschiedene IT-Abteilungen, die Vorfälle auf die gleiche Weise überwachen und messen. Streng auf der Grundlage des Prozentsatzes der Vorfälle, die die Zielzeit und MTTR überschreiten, ist IT-Abteilung B der klare Gewinner. Wenn Sie die tatsächlichen Vorfallgesamtzahlen und kumulierten Zeiten nicht berücksichtigen, ist es zu einfach, am Ende wertlose Statistiken zu vergleichen.
Tabelle A: Vorfallmanagement und MTTR
IT-Abteilung | Anzahl der Vorfälle pro Monat | # Vorfälle über Zielzeit | Kumulativ Vorfallzeit | % Vorfälle über Zielzeit |
MTTR |
A | 3 | 1 | 4,5 Stunden | 33,33 % | 1,5 Stunden |
B | 35 | 10 | 26.25 Stunden | 28,57 % | 0,75 Stunden |
Halten Sie Ihre Zahlen niedrig
Wie auch immer Sie die Lösungszeit messen, die einzige Konstante ist die Notwendigkeit (normalerweise begleitet von Druck aus der Führungsebene), diese Zahl niedrig zu halten. Was können Sie tun?
Es gibt mehrere Schritte, die Sie unternehmen können, und wenn Sie sie gemeinsam unternehmen, können sie eine positive Wirkung erzielen. Im Folgenden finden Sie sechs wesentliche Schritte, mit denen Sie ab sofort beginnen sollten:
- Verwenden Sie ein schnelles und genaues Vorfallmanagementsystem.
Eine Reaktion beginnt mit Ihrem Incident-Management-System. Wie erhält Ihr Reaktionsteam Warnmeldungen? Bekommen sie während der normalen Bürozeiten Anrufe und E-Mails von Endbenutzern? Ein solches System ist für Probleme mit niedriger Priorität und Funktionsanfragen in Ordnung. Sie benötigen ein automatisiertes Vorfallsystem, das die entsprechenden Leiter des Reaktionsteams über globale Mehrkanal-Kommunikationsoptionen (Telefonanrufe, SMS, E-Mail oder ein anderes Kommunikationssystem für schnelle Reaktionen) sofort benachrichtigt, wenn ein Vorfall erkannt oder gemeldet wird. Vorfälle sollten an die richtigen Teamleiter weitergeleitet werden, um Verwirrungen oder Missverständnisse darüber zu vermeiden, wer für die Bearbeitung des Vorfalls verantwortlich ist. - Reduzieren Sie Alarmgeräusche und filtern Sie Nicht-Alarme.
Filtern und begrenzen Sie Alarmgeräusche von Anfang an, damit die Einsatzteams nicht mit Vorfällen niedriger Priorität oder, noch schlimmer, mit Nicht-Vorfällen beschäftigt sind, die vor dem Einsatz nicht gefiltert wurden. Diese Funktionen sollten in Ihr Alarm- und Einsatzsystem integriert sein und können weitgehend automatisiert werden. - Halten Sie die Zeiten zur Vorfallbestätigung kurz.
Dies betrifft sowohl das Warnsystem als auch die Reaktionsteams. Wenn nach einer festgelegten (und sehr kurzen) Zeit keine Bestätigung eines Vorfalls erfolgt, sollte der Vorfall automatisch an ein zweites Teammitglied, dann an ein drittes usw. weitergeleitet werden. Wenn kein Teammitglied den Vorfall bestätigt, sollte er an ein zweites Team (oder an das IT-Management) weitergeleitet werden. Vorfälle sollten nicht auf unbestimmte Zeit ohne Bestätigung in der Schwebe bleiben. - Von Anfang an Prioritäten setzen .
Legen Sie eine klare Priorität fest, die auf Faktoren wie Schwere und Ausmaß des Vorfalls, den betroffenen Systemen und deren Auswirkungen auf den Unternehmensbetrieb basiert. Dies kann sich unterschiedlich auf Ihre MTTR auswirken, aber wenn Sie von Anfang an genau wissen, welche Vorfälle die meiste Aufmerksamkeit erfordern und welche warten können, reduzieren Sie Zeitverschwendung und verkürzen letztendlich die Lösungszeit. - Nutzen Sie die Zusammenarbeit in Echtzeit.
Ziehen Sie bei Bedarf an entscheidenden Punkten der Vorfalllösung Spezialteams und Supportressourcen hinzu. Echtzeit-Zusammenarbeit über die entsprechenden Medien (darunter VPN und Live-Video sowie Text und Sprache) kann den Unterschied zwischen einer schnellen, sofortigen Lösung und dem Warten auf eine E-Mail-Nachricht am nächsten Werktag ausmachen. - Bilden Sie Reaktionsteams mit klaren Rollen.
Die Reaktion auf Vorfälle sollte niemals ad hoc erfolgen. Jedes Team sollte einen Leiter haben und alle Teammitglieder sollten sich über die Verantwortlichkeiten der anderen im Klaren sein. Die Kommunikation sowohl innerhalb des Teams als auch mit Stakeholdern außerhalb des Teams sollte klar und offen sein.
Es gibt noch viele weitere Maßnahmen, mit denen Sie die Reaktionszeit verkürzen können. Für größere Organisationen kann beispielsweise ein formelles Befehlssystem mit Notfallübungen sinnvoll sein. Wenn Sie jedoch die oben aufgeführten Richtlinien befolgen, sollten Sie in der Lage sein, die MTTR-Zahlen Ihres IT-Teams auf ein Niveau zu senken, bei dem Sie nicht in den Himmel schreien müssen.