Der Blog

Vorfallanalyse: Wen sollten Sie befragen?

von Jeli 25. Februar 2022 | 7 min Lesezeit

Dieser Beitrag wurde ursprünglich im Jeli-Blog veröffentlicht. Jeli wurde 2023 von PagerDuty übernommen und wir veröffentlichen ihn hier erneut, um unserer Community ihre Vordenkerrolle nahezubringen.

Wenn wir uns die Zeit nehmen, Teilnehmer nach einem Vorfall zu interviewen, können wir das Fachwissen jedes Einzelnen freisetzen und es im gesamten Unternehmen weitergeben. Durch das Interviewen werden Berichte aus erster Hand erstellt, die das Wissen Ihrer Teams (und auch die Wissenslücken) hervorheben, die Strategien, die Ingenieure zum Umgang mit unerwartetem Systemverhalten verwenden, und alle Schwierigkeiten, die die Bemühungen zur Wiederherstellung des Dienstes behindert haben. Dies sind wichtige Informationen, die gesammelt werden müssen. So können alle leichter aus der Erfahrung lernen, auch diejenigen, die nicht dabei waren, und das Unternehmen erhält die Gelegenheit zu untersuchen, wie bestehende Praktiken und Prozesse bei Vorfällen helfen oder behindern.

Damit möchte ich sagen, dass die Zeit, die Sie mit der Untersuchung verbringen, sinnvoll für Interviews genutzt werden kann. Sie liefern Ihnen wertvolle Erkenntnisse, die Ihre Transkriptprüfungen ergänzen, und können der effizienteste Weg sein, um zum Kern des Wesentlichen bei diesem bestimmten Vorfall vorzudringen. In diesem Beitrag gehen wir davon aus, dass Sie dies erkennen und sich die Zeit für Interviews nehmen können.


Wen sollten Sie interviewen?

Sie sind also davon überzeugt, Interviews zu führen. Sie denken vielleicht: „An diesem Vorfall waren über 200 Personen beteiligt, und über 20 waren super aktiv! Wie soll ich all diese wichtigen Interviews jemals vor meiner Vorfall-Retrospektive in 5 Tagen durchführen?!“ Die gute Nachricht ist, dass Sie, als Sie mit Ihrer ersten Analyse begannen und begannen, das Ereignis zu verstehen, bereits einen Teil der Vorarbeit geleistet haben, die zur Identifizierung der Hauptakteure erforderlich ist! Die noch bessere Nachricht ist, dass Experten diese Arbeit seit Jahren durchführen, sodass Sie nicht bei Null anfangen müssen.

Wie hervorgehoben in der Howie-Führer sind hier einige Dinge, die Sie bei der Entscheidung, wen Sie interviewen, berücksichtigen sollten:

  • Schlüsselspieler aus Schlüsselmomenten
    Erkennung, Diagnose oder Lösung des Vorfalls – wenn jemand maßgeblich an einem dieser Dinge beteiligt war oder die Ursache dafür war, sollten Sie einen Termin ausmachen.
    Die Schlüsselpersonen, die an einem Vorfall beteiligt sind, sind normalerweise (aber nicht immer!) Personen, die Ihnen sowohl allgemeine als auch spezifische Perspektiven zum Ereignis geben können. Eine allgemeine Perspektive kann beispielsweise vom Einsatzleiter kommen, der die Aktivitäten während des Vorfalls geleitet hat. Sein Überblick über das Ereignis hilft Ihnen, sich schnell im Vorfall zurechtzufinden. Eine weitere Schlüsselperson könnte der Einsatzleiter sein, der das Problem identifiziert oder eine Schadensbegrenzung/Reparatur vorgeschlagen hat. Er kann Ihnen helfen, die spezifischeren, technischen Details des Fehlers zu verstehen. Schlüsselpersonen kommen auch aus den Bereichen Kundensupport, Außendiensttechnik, Kundenerfolgsmanagement und Vertrieb des Unternehmens. Oft waren diese Schlüsselpersonen bei Vorfällen die Personen, die zeitnahe, spezifische Informationen aus der Sicht des Kunden einbrachten. Abhängig von den Regeln Ihrer Organisation können sogar die Kunden selbst befragt werden, da sie über umfassende Kontext- und Informationsquellen verfügen! Das wichtigste Ziel der Befragung von Schlüsselpersonen besteht darin, die Informationen, die Sie aus der Zeit erhalten, die Sie mit den Beteiligten verbringen, zu maximieren.
  • Personen, von denen Sie nicht erwartet haben, dass sie in den Vorfall verwickelt werden
    Dies kann Personen einschließen, die nicht auf Abruf bereitstanden oder nicht zum Team des betroffenen Systems gehörten.
    Unabhängig davon, ob sie in den Vorfall hineingezogen wurden oder von sich aus eingegriffen haben, kann Ihnen die Zeit, diese Personen zu interviewen, Einblicke in deren Fachwissen (wahrgenommen oder anderweitig!) geben. Wenn jemand absichtlich in einen Vorfall hineingezogen wird, liegt das normalerweise daran, dass er Kenntnisse über ein System hat, die ihn im Eifer des Gefechts unglaublich nützlich machen. Indem Sie sie interviewen und diese Erkenntnisse in Ihrem Moderationsmeeting teilen, können Sie beginnen, dieses Fachwissen zu verbreiten, sodass beispielsweise „Suzie“ nicht mehr die einzige Person ist, die weiß, wie Consul funktioniert.
  • Menschen, die sich möglicherweise beschuldigt fühlen
    Es ist wichtig, dass Personen, die sich in irgendeiner Weise für den Vorfall „verantwortlich“ fühlen, in einem Interview ihre Perspektive darlegen können, damit ihre Erfahrungen bei der Untersuchung genau wiedergegeben werden können.
    Diese Interviews sind entscheidend, um eine psychologisch sichere Umgebung zu schaffen. Es ist wichtig, dass die Menschen das Gefühl haben, dass ihre Perspektive nicht nur gehört, sondern auch fair vertreten wird und dass ihnen nicht die Schuld für Vorfälle gegeben wird. Diese Interviews können auch zusätzliche Faktoren in Bezug auf organisatorische Prozesse ans Licht bringen, die in anderen Datenquellen möglicherweise übersehen wurden.
  • Eigentümer, vermeintliche Eigentümer oder umstrittene Eigentümer betroffener Systeme
    Auch ehemalige Eigentümer können interessante Interviewpartner sein.
    Diese Personen verfügen in der Regel über ein hohes Maß an Verständnis für das System, was zu einer produktiveren Retrospektive und einer aussagekräftigeren Vorfallberichtszusammenfassung führen kann. Scheinbar grundlegende Kenntnisse über die Funktionsweise des gesamten Systems stellen den Vorfall in einen wertvollen Kontext, der, wenn er in Ihren Vorfallbericht aufgenommen wird, die Wahrscheinlichkeit erhöht, dass er später gelesen und weitergegeben wird.
  • Fachexperten (KMU) und Menschen, die auf „Wissensinseln“ leben
    Jeder, der sich mit den Systemen oder Komponenten auskennt, die an dem Vorfall beteiligt waren, kann interviewt werden. Und diejenigen, die „die einzige Person sind, die weiß, wie man einen Ausfall behebt“, verfügen über Fachwissen, das weiter verbreitet werden sollte.
    Ähnlich wie bei Eigentümern kann die Befragung von Fachexperten dabei helfen, das tatsächliche Maß an Fachwissen zu ermitteln, das für den Betrieb des Systems erforderlich ist. Oftmals fällt es Experten schwer, ihr Fachwissen zu dokumentieren und zu erklären, sodass eine Befragung (selbst mit sehr einfachen Fragen) dieses Wissen hervorbringen kann. Wir fragen KMU häufig: „Wie bekannt ist dies in Ihrem Team?“ und erhalten überraschend oft die Antwort „überhaupt nicht bekannt“. Dies sind gute Anzeichen dafür, dass die Weitergabe dieses Wissens in einem Bericht oder einer Lernbewertung eine Möglichkeit ist, Wissenssilos aufzubrechen und eine Schulungsmöglichkeit für andere zu bieten, um dieses Fachwissen breiter zu entwickeln.
  • 'Einsame wölfe'
    Menschen, die unabhängig von Gruppenanstrengungen handeln, können darauf hinweisen, dass sie eine andere Sicht auf die Funktionsweise des Systems haben.
    Einzelkämpfer gelten oft als kontraproduktiv bei der Reaktion auf Vorfälle, aber es lohnt sich, den „Warum“-Gründen nachzugehen, warum sie ihre Aktivitäten nicht mit anderen koordiniert haben. Diese Interviews könnten potenzielle Probleme mit Teamdynamik, Prozessen oder Kommunikationskanälen ans Licht bringen, die zu diesem unabhängigen Handeln beigetragen haben könnten.
  • Der Ticketaussteller und/oder die Person, die das Wechselgeld ausgestellt hat
    Person, die das Ticket geschrieben hat, das die Person dazu veranlasst hat, Änderungen in Bezug auf den Vorfall vorzunehmen, und/oder die Person, die die besagte Änderung vorgenommen hat.
    Durch die Befragung dieser Personen können wir wichtige Einblicke in die Schritte erhalten, die zu dem Vorfall geführt haben. Stellen Sie Fragen wie „Hatten wir den richtigen Kontext zum System und zur Organisation, als wir das Ticket geschrieben haben? Was hat dazu geführt, dass es weitergeleitet wurde?“
  • Personen, die neu in der Organisation sind
    Ziemlich selbsterklärend. Fragen Sie die Neulinge.

Durch die Befragung dieser Leute können wir verborgene Annahmen über unsere Systeme ans Licht bringen.

Arbeiten unter Zeitdruck

In diesem Artikel ging es darum, wen Sie im Rahmen einer lernorientierten Vorfall-Retrospektive interviewen sollten. Wir alle haben jedoch zeitliche Einschränkungen, die uns zwingen, bei der Interviewführung Kompromisse einzugehen.

Wenn Ihre Interviewpartner nicht verfügbar sind oder Ihnen die Zeit ausgeht, bevor Sie einen Bericht abgeben oder ein Meeting moderieren müssen, finden Sie hier ein paar Vorschläge, wie Sie vorgehen können:

  • Führen Sie zuerst die „hochwertigen“ Interviews durch, damit Sie in kurzer Zeit möglichst viel Kontext erhalten.
  • Reduzieren Sie die Länge Ihrer Interviews, anstatt sie ganz abzuschaffen
  • Stellen Sie die Fragen in einer Direktnachricht oder in einem Google-Dokument, damit der Interviewte asynchron antworten kann
  • Bereiten Sie eine Zusammenfassung auf der Grundlage anderer Informationen vor, die Sie gesammelt haben, und bitten Sie den Interviewpartner, diese zu überprüfen und zu kommentieren. Dies hilft dabei, die Zeit, die dem Interviewpartner zur Verfügung steht, auf die Überprüfung und Klärung zu verwenden, anstatt Verständnis aufzubauen.
  • Bemühen Sie sich, Ihre Interviews zu beenden, wenn die Menge an relevanten neuen Informationen merklich abnimmt
  • Verwenden Sie ein Kalibrierungsdokument, um fortlaufende asynchrone Diskussionen zu ermöglichen

Wenn wir uns die Zeit nehmen, mit den Einsatzkräften in Form von Interviews zu sprechen, können wir Erkenntnisse über unsere Systeme gewinnen – sowohl technische als auch soziotechnische –, die uns in Zukunft bei der Bewältigung von Zwischenfällen widerstandsfähiger machen. Ausführlichere Informationen zu diesen und anderen Themen finden Sie jederzeit auf der Howie: Der Leitfaden nach dem Vorfall , unsere Schritt-für-Schritt-Plug-and-Play-Anleitung zur Vorfallanalyse.