- PagerDuty /
- Blog /
- Innovation /
- Rendre notre documentation de réponse aux incidents accessible en open source
Blog
Rendre notre documentation de réponse aux incidents accessible en open source
La fiabilité a toujours été l'une des principales considérations de conception chez PagerDuty. (Nous avons même utiliser PagerDuty à PagerDuty !) Mais que faire lorsque l'inattendu se produit et que quelque chose se passe mal ? Il est de la plus haute importance que nous soyons préparés et que nous puissions remettre nos systèmes en parfait état de fonctionnement le plus rapidement possible. Nous sommes fiers de pouvoir résoudre rapidement les problèmes qui surviennent et de maintenir nos systèmes en état de fonctionnement dans le cadre de leur SLA. Nous avons travaillé très dur pour y parvenir, et notre processus de réponse aux incidents est le point de départ de tout.
Notre documentation interne sur les interventions en cas d'incident est le fruit de nos efforts de développement au cours des dernières années, au fil des leçons que nous avons tirées de nos erreurs. Elle détaille les meilleures pratiques de notre processus, de la préparation des nouveaux employés aux responsabilités d'astreinte à la gestion des incidents majeurs, tant en préparation qu'après le travail. Peu d'entreprises semblent parler de leurs processus internes de gestion des incidents majeurs. Il est parfois considéré comme tabou de mentionner le mot « incident » dans toute forme de communication. Nous aimerions changer cela.
À cette fin, nous sommes heureux d'annoncer que nous avons désormais ouvert le code source de notre documentation de réponse aux incidents à l'usage de la communauté ! Apprenez comment nous nous préparons aux incidents, gérons les incidents majeurs et formons nos ingénieurs à intervenir sur appel. Nous espérons que d'autres utiliseront la documentation comme point de départ pour formaliser leurs propres processus.
Qu'est-ce que c'est?
Le Documentation de réponse aux incidents de PagerDuty est un recueil de bonnes pratiques détaillant comment gérer efficacement les incidents majeurs qui pourraient survenir, ainsi que des informations sur la manière de réagir efficacement en cas d'astreinte. Il fournit des leçons apprises à la dure, ainsi que du matériel de formation pour vous permettre de vous mettre rapidement à niveau.
C'est pour qui?
Il est destiné aux praticiens de garde et à ceux impliqués dans un processus de réponse aux incidents opérationnels, ou à ceux qui souhaitent mettre en place un processus formel de réponse aux incidents.
Pourquoi en ai-je besoin ?
La réponse aux incidents est un élément que chaque organisation doit prendre en compte afin de fournir le meilleur service possible à ses propres clients. Normalement, les connaissances sur la façon de gérer les incidents au sein de votre entreprise s'accumulent au fil du temps, s'améliorant à chaque incident. Alors que des outils tels que PagerDuty Demande d'incidents majeurs peut vous aider à récupérer rapidement, le processus que vous suivez est tout aussi important. Cette documentation vous aidera à réduire votre temps de réponse aux incidents majeurs en vous appuyant sur les connaissances que nous avons développées en interne au fil des ans.
Qu'est-ce qui est couvert?
Il couvre tout, de la préparation à être de garde , définitions de gravités , incident étiquette d'appel , jusqu'à la façon de gérer un autopsie (nous fournissons même notre modèle d'autopsie ). Nous incluons même notre processus de réponse aux incidents de sécurité .
Que manque-t-il?
Il convient de noter que ce n'est pas un clone exact de notre documentation interne ; certaines informations ont été supprimées ou modifiées. Il s'agit notamment de nos numéros de téléphone, des noms d'outils et de systèmes internes qui ne sont pas (encore) open source, des images de nos tableaux de bord, etc. Nous avons essentiellement omis tout ce qui est spécifique à PagerDuty ou que nous considérons comme trop exclusif pour être partagé. La majeure partie des informations utiles se situe dans les principes et les processus, plutôt que dans les spécificités des outils que nous utilisons.
Licence
La documentation est fournie sous la licence Apache 2.0. En clair, cela signifie que vous pouvez utiliser et modifier la documentation et l'utiliser à la fois à des fins commerciales et privées. Cependant, vous devez inclure tous les avis de droits d'auteur originaux et le fichier LICENSE original.
Que vous soyez client de PagerDuty ou non, nous souhaitons que vous ayez la possibilité d'utiliser cette documentation en interne dans votre propre entreprise. Vous pouvez voir le code source pour toute cette documentation sur notre compte GitHub. N'hésitez pas à dupliquer le dépôt et à l'utiliser comme base pour votre propre documentation interne.
Nous vous encourageons également à formuler des demandes d'extraction si vous avez des suggestions d'amélioration.