Der Blog

Vorfallanalyse: Wen sollten Sie befragen?

von Jeli 25. Februar 2022 | 7 Minuten Lesezeit

Dieser Beitrag wurde ursprünglich im Jeli-Blog veröffentlicht. Jeli wurde 2023 von PagerDuty übernommen und wir veröffentlichen ihn hier erneut, um unserer Community die Vordenkerrolle des Unternehmens näherzubringen.

Wenn wir uns nach einem Vorfall die Zeit nehmen, die Teilnehmer zu befragen, können wir das Fachwissen jedes Einzelnen erschließen und im gesamten Unternehmen weitergeben. Durch die Befragung werden Erfahrungsberichte generiert, die das vorhandene Wissen Ihrer Teams (und auch die Wissenslücken), die Strategien der Ingenieure im Umgang mit unerwartetem Systemverhalten und alle Schwierigkeiten, die die Wiederherstellung des Dienstes behindert haben, beleuchten. Diese Informationen sind von entscheidender Bedeutung. Sie helfen allen, selbst denen, die nicht dabei waren, leichter aus der Erfahrung zu lernen, und geben dem Unternehmen die Möglichkeit zu analysieren, wie bestehende Praktiken und Prozesse bei Vorfällen hilfreich oder hinderlich sind.

Damit möchten wir Ihnen zeigen, dass Interviews eine sinnvolle Nutzung Ihrer Ermittlungszeit sind. Sie liefern Ihnen wertvolle Erkenntnisse, die Ihre Transkriptprüfungen ergänzen, und sind der effizienteste Weg, um den Kern des Vorfalls zu ergründen. In diesem Beitrag gehen wir davon aus, dass Sie sich dessen bewusst sind und sich die Zeit für Interviews nehmen können.


Wen sollten Sie interviewen?

Sie sind also überzeugt, Interviews zu führen. Sie denken vielleicht: „An diesem Vorfall waren über 200 Personen beteiligt, und über 20 davon waren extrem aktiv! Wie soll ich all diese wichtigen Interviews jemals vor meiner Vorfall-Retrospektive in 5 Tagen durchführen?!“ Die gute Nachricht: Als Sie mit Ihrer ersten Analyse begannen und das Ereignis zu verstehen begannen, haben Sie bereits einen Teil der Vorarbeit geleistet, um die Schlüsselakteure zu identifizieren! Und die noch bessere Nachricht: Experten machen diese Arbeit seit Jahren, Sie müssen also nicht bei Null anfangen.

Wie hervorgehoben in der Howie-Führer , hier sind einige Dinge, die Sie bei der Entscheidung, wen Sie interviewen, berücksichtigen sollten:

  • Schlüsselspieler aus Schlüsselmomenten
    Erkennung, Diagnose oder Lösung des Vorfalls – wenn jemand stark in eines dieser Dinge verwickelt war oder die Anklage angeführt hat, planen Sie es ein.
    Die Schlüsselpersonen eines Vorfalls sind in der Regel (aber nicht immer!) Personen, die Ihnen sowohl allgemeine als auch spezifische Einblicke in das Ereignis geben können. Eine allgemeine Perspektive kann beispielsweise der Einsatzleiter bieten, der die Vorfallaktivitäten geleitet hat. Seine Übersicht über das Ereignis hilft Ihnen, sich schnell zurechtzufinden. Eine weitere Schlüsselperson könnte der Mitarbeiter sein, der das Problem identifiziert oder die Schadensbegrenzung/Reparatur vorgeschlagen hat. Er kann Ihnen helfen, die spezifischeren technischen Details des Fehlers zu verstehen. Schlüsselpersonen kommen auch aus den Bereichen Kundensupport, Außendiensttechnik, Kundenerfolgsmanagement und Vertrieb. Oft waren diese Schlüsselpersonen bei Vorfällen diejenigen, die zeitnah spezifische Informationen aus Kundensicht lieferten. Abhängig von den Regeln Ihrer Organisation können sogar die Kunden selbst befragt werden, da sie über umfassende Kontext- und Informationsquellen verfügen! Das wichtigste Ziel der Befragung von Schlüsselpersonen besteht darin, den Informationsgewinn aus den Gesprächen mit den Beteiligten zu maximieren.
  • Personen, von denen Sie nicht erwartet hatten, dass sie in den Vorfall verwickelt werden
    Dazu können auch Leute gehören, die nicht auf Abruf waren oder nicht zum Team des betroffenen Systems gehörten.
    Unabhängig davon, ob sie in den Vorfall hineingezogen wurden oder sich freiwillig einmischten, kann Ihnen die Befragung dieser Personen Einblicke in deren Fachwissen (vermeintlich oder anderweitig!) geben. Wenn jemand absichtlich in einen Vorfall hineingezogen wird, liegt das in der Regel daran, dass er über Systemkenntnisse verfügt, die ihn im Ernstfall unglaublich nützlich machen. Indem Sie diese Personen befragen und die Erkenntnisse in Ihrem Moderationsmeeting teilen, können Sie dieses Fachwissen verbreiten, sodass beispielsweise „Suzie“ nicht mehr die einzige Person ist, die weiß, wie Consul funktioniert.
  • Menschen, die sich möglicherweise beschuldigt fühlen
    Es ist wichtig, dass Personen, die sich in irgendeiner Weise für den Vorfall „verantwortlich“ fühlen, in einem Interview ihre Sicht der Dinge darlegen können, damit ihre Erfahrungen bei der Untersuchung richtig wiedergegeben werden können.
    Diese Interviews sind entscheidend für die Schaffung einer psychologisch sicheren Umgebung. Es ist wichtig, dass die Menschen das Gefühl haben, dass ihre Perspektive nicht nur gehört, sondern auch fair vertreten wird und ihnen nicht die Schuld für Vorfälle gegeben wird. Diese Interviews können auch zusätzliche Faktoren in Bezug auf organisatorische Prozesse aufdecken, die in anderen Datenquellen möglicherweise übersehen wurden.
  • Eigentümer, vermeintliche Eigentümer oder umstrittene Eigentümer betroffener Systeme
    Auch ehemalige Eigentümer können interessante Interviewpartner sein.
    Diese Personen verfügen in der Regel über ein hohes Maß an Systemverständnis, was zu einer produktiveren Retrospektive und einer aussagekräftigeren Vorfallsberichtserstellung führen kann. Scheinbar grundlegende Kenntnisse über die Funktionsweise des gesamten Systems stellen den Vorfall in einen wertvollen Kontext. Wenn Sie diese Kenntnisse in Ihren Vorfallsbericht einbeziehen, erhöht dies die Wahrscheinlichkeit, dass dieser später gelesen und weitergegeben wird.
  • Fachexperten (KMU) und Menschen, die auf „Wissensinseln“ leben
    Jeder, der sich mit den vom Vorfall betroffenen Systemen oder Komponenten auskennt, kann interviewt werden. Und diejenigen, die „die einzige Person sind, die weiß, wie man einen Ausfall behebt“, verfügen über Fachwissen, das weiter verbreitet werden sollte.
    Ähnlich wie bei Eigentümern kann die Befragung von Fachexperten dazu beitragen, das tatsächlich erforderliche Fachwissen für den Betrieb des Systems besser zu ermitteln. Experten fällt es oft schwer, ihr Fachwissen zu dokumentieren und zu erklären. Daher kann eine Befragung (selbst mit sehr einfachen Fragen) dieses Wissen fördern. Wir fragen KMU oft: „Wie bekannt ist das in Ihrem Team?“ und erhalten überraschend oft die Antwort „Überhaupt nicht bekannt“. Dies sind gute Anzeichen dafür, dass die Weitergabe dieses Wissens in einem Bericht oder einer Lernübersicht eine Möglichkeit ist, Wissenssilos aufzubrechen und anderen eine Schulungsmöglichkeit zu bieten, um dieses Fachwissen breiter zu entwickeln.
  • „Einsame Wölfe“
    Menschen, die unabhängig von Gruppenbemühungen handeln, können zeigen, dass sie eine andere Sicht auf die Funktionsweise des Systems haben.
    Einzelkämpfer gelten oft als kontraproduktiv für die Reaktion auf Vorfälle. Es lohnt sich jedoch, den Gründen nachzugehen, warum sie ihre Aktivitäten nicht mit anderen koordiniert haben. Diese Interviews könnten potenzielle Probleme mit der Teamdynamik, den Prozessen oder den Kommunikationskanälen aufdecken, die zu diesem unabhängigen Handeln beigetragen haben könnten.
  • Der Ticketaussteller und/oder die Person, die das Wechselgeld ausgestellt hat
    Person, die das Ticket geschrieben hat, das die Person dazu veranlasst hat, Änderungen im Zusammenhang mit dem Vorfall vorzunehmen, und/oder die Person, die die besagte Änderung vorgenommen hat.
    Durch die Befragung dieser Personen erhalten wir wichtige Einblicke in die Schritte, die zu dem Vorfall geführt haben. Stellen Sie Fragen wie: „Hatten wir den richtigen Kontext zum System und zur Organisation, als wir das Ticket geschrieben haben? Was hat dazu geführt, dass es weitergeleitet wurde?“
  • Personen, die neu in der Organisation sind
    Ziemlich selbsterklärend. Fragen Sie die Neulinge.

Durch die Befragung dieser Leute können wir verborgene Annahmen über unsere Systeme ans Licht bringen.

Arbeiten mit Zeitbeschränkungen

In diesem Artikel ging es darum, wen Sie im Rahmen einer lernorientierten Vorfall-Retrospektive interviewen sollten. Wir alle sind jedoch zeitlich eingeschränkt und müssen bei der Interviewführung Kompromisse eingehen.

Wenn Ihre Zielinterviewpartner nicht verfügbar sind oder Ihnen die Zeit ausgeht, bevor Sie einen Bericht abgeben oder ein Meeting moderieren müssen, finden Sie hier einige Vorschläge, wie Sie vorgehen können:

  • Führen Sie Ihre „hochwertigen“ Interviews zuerst durch, um in kurzer Zeit möglichst viel Kontext zu erhalten.
  • Reduzieren Sie die Länge Ihrer Interviews, anstatt sie ganz zu eliminieren
  • Stellen Sie die Fragen in einer Direktnachricht oder in einem Google-Dokument, damit der Befragte asynchron antworten kann
  • Bereiten Sie eine Zusammenfassung basierend auf den anderen gesammelten Informationen vor und bitten Sie den Interviewpartner, diese zu überprüfen und zu kommentieren. So können Sie die verfügbare Zeit gezielter auf die Überprüfung und Klärung konzentrieren, anstatt Verständnis aufzubauen.
  • Bemühen Sie sich, Ihre Interviews zu beenden, wenn die Menge an relevanten neuen Informationen merklich abnimmt
  • Verwenden Sie ein Kalibrierungsdokument, um fortlaufende asynchrone Diskussionen zu ermöglichen

Wenn wir uns die Zeit nehmen, mit den Einsatzkräften in Interviews zu sprechen, können wir Erkenntnisse über unsere Systeme gewinnen – sowohl technische als auch soziotechnische – und so bei zukünftigen Vorfällen widerstandsfähiger sein. Ausführlichere Informationen zu diesen und anderen Themen finden Sie jederzeit im Howie: Der Leitfaden nach dem Vorfall , unsere Schritt-für-Schritt-Plug-and-Play-Anleitung zur Vorfallanalyse.