- PagerDuty /
- Blog /
- Opérations numériques /
- Comment le PagerDuty Operations Cloud peut jouer un rôle dans votre stratégie DORA (Digital Operational Resilience Act)
Blog
Comment le PagerDuty Operations Cloud peut jouer un rôle dans votre stratégie DORA (Digital Operational Resilience Act)
Depuis que j'ai écrit DORA contre DORA ! , un certain nombre de personnes m'ont demandé si je pouvais donner des conseils plus pratiques sur la façon dont PagerDuty Operations Cloud peut jouer un rôle en aidant les entreprises du secteur des services financiers (FSI) à remplir leurs obligations en vertu de DORA. Laissez-moi essayer de le faire maintenant.
Clause de non-responsabilité: Veuillez noter que même si PagerDuty peut fournir des pièces du puzzle vraiment utiles, je ne suggère en aucun cas que vous pouvez atteindre la conformité DORA instantanée simplement en adoptant PagerDuty Operations Cloud. Ce que je suggère, c'est que lorsqu'il est combiné avec une stratégie bien pensée, un peu de conseil et plus qu'un peu de muscle PagerDuty , vous pouvez vous rapprocher beaucoup plus de la conformité DORA.
Lorsque nous parlons de résilience opérationnelle avec nos clients, trois thèmes communs reviennent :
- Les équipes ne consacrent pas suffisamment de temps à la conception préventive.
- Les leçons tirées des incidents passés ne sont pas exploitées.
- La résolution des incidents est lente en raison du bruit et du manque de systèmes en temps réel.
Ainsi, une approche proactive de votre planification et de votre stratégie DORA aidera à résoudre certains de ces problèmes. Passons en revue les principaux piliers de DORA et voyons où PagerDuty peut vous aider. Pour notre public britannique, je soulignerai les domaines dans lesquels je pense qu'un élément particulier est également pertinent par rapport à la réglementation britannique (par exemple, FCA PS21/3/PRA PS6/21).
- Gestion robuste des risques liés aux TIC
Dans le cadre de la gestion des risques liés aux TIC, la DORA impose la mise en place de systèmes processus de gestion des incidents C'est vraiment la raison d'être de PagerDuty, donc je vais essayer d'être succinct.
-
- Surveillance et alerte : Les capacités AIOps de PagerDuty Operations Cloud sont construites sur notre modèle de données de base et formées sur plus d'une décennie de données clients. Il peut être utilisé pour réduire le bruit en rassemblant et en agrégeant les événements provenant d’une multitude de systèmes et d’outils informatiques. Avec plus de 700 intégrations prêtes à l'emploi , PagerDuty peut être configuré pour recevoir des événements et des alertes provenant de diverses sources, telles que des outils de surveillance du cloud et du réseau, des systèmes de gestion des informations et des événements de sécurité (SIEM) et des outils de gestion des changements. Cela permet une détection précoce des problèmes potentiels qui pourraient se transformer en problèmes plus importants.
-
- Routage des alertes, appel et escalade : PagerDuty permet aux entreprises de définir des protocoles de notification pour différents types d'incidents en fonction de l'urgence et de la gravité. PagerDuty fonctionne sur un modèle basé sur les services – pensez aux services commerciaux importants (IBS) identifiés dans les règlements PRA – et achemine les alertes directement aux équipes et aux individus les plus appropriés qui possèdent l'expertise nécessaire pour gérer la situation. Cela réduit radicalement le temps moyen de restauration (MTTR) du service. Il est également possible de visualiser ces IBS et de voir leurs dépendances en amont et en aval dans le graphique de service.
-
- Automatisation de PagerDuty , automatisation des flux de travail et flux de travail d'incidents : PagerDuty propose des outils pour créer des flux de travail standardisés pour gérer les incidents. Ces flux de travail peuvent inclure des étapes automatisées de dépannage, de diagnostic et de résolution des incidents, favorisant ainsi une approche cohérente et reproductible de la gestion des risques informatiques dans l'ensemble de l'organisation.
- Gestion, classification et signalement des incidents liés aux TIC :
La DORA impose de signaler les incidents opérationnels qui ont un impact significatif ou potentiel sur la prestation des services financiers. Cela nécessite d'établir des procédures claires pour identifier, signaler et analyser ces incidents.
-
- Registre centralisé immuable des incidents : PagerDuty fournit un journal horodaté de toutes les activités et étapes de résolution liées à un incident. Cet enregistrement central fournit une piste d'audit claire pour tous les incidents, simplifiant ainsi la conformité aux exigences de reporting de DORA.
- Rapports automatisés : PagerDuty comprend une suite de tableaux de bord et de rapports analytiques prêts à l'emploi, mais permet également une intégration avec des systèmes externes, permettant potentiellement un reporting automatisé des incidents majeurs aux autorités compétentes sur la base de critères prédéfinis. PagerDuty fournit également des modèles de mise à jour de statut et des pages de statut basées sur le Web – directement associées et liées aux services commerciaux importants (PRA encore une fois) – pour permettre une communication de masse immédiate avec les parties prenantes et les clients.
- Tests de résilience opérationnelle numérique :
La réglementation DORA et britannique exige explicitement que les institutions FinServ effectuent des tests réguliers de leurs systèmes TIC et de leurs plans de réponse aux incidents afin d'identifier les vulnérabilités de leur résilience opérationnelle. Ces tests doivent inclure l'exécution régulière de simulations de divers scénarios perturbateurs.
-
- Simulation d'incident : Entraînez-vous, entraînez-vous, entraînez-vous ! Les capacités de PagerDuty Automation pourraient être utilisées pour lancer un incident simulé. Les entreprises peuvent également désactiver manuellement une machine ou une application ou créer un incident de test PagerDuty pour déclencher une panne, puis mettre en pratique leurs procédures de réponse. Cela permet d’identifier les faiblesses et les domaines à améliorer dans le plan de réponse aux incidents. PagerDuty, en tant qu'entreprise, effectue chaque semaine de telles simulations dans ses propres systèmes (ce qu'on appelle le « Vendredi des échecs » !). Bien entendu, la résilience opérationnelle va au-delà de la technologie pour englober les personnes et les processus. Nous avons « open source » la procédure de réponse aux incidents PagerDuty – y compris les rôles et responsabilités – et vous êtes libre d'en prendre une copie et de la personnaliser à votre guise ( réponse.pagerduty.com ).
- PagerDuty permet la résilience opérationnelle : Lors d'un incident - réel ou simulé - les capacités de base de PagerDuty Operations Cloud (AIOPs, PagerDuty Automation et Incident Response) combinées aux processus et à la formation de réponse aux incidents d'une entreprise aideront les entreprises à réduire le délai moyen d'accusé de réception (MTTA) et résoudre (MTTR) l’incident et ainsi minimiser les perturbations.
- Analyse post-test (revues post-incident ou post-mortem) :La fonctionnalité GenAI de PagerDuty (en accès anticipé) facilite la création de tels rapports, permettant aux entreprises d'analyser les délais de résolution des incidents et la collaboration des équipes lors des scénarios de test. Ces données sont précieuses pour affiner le plan de réponse aux incidents et améliorer la rapidité et l'efficacité des processus de résilience opérationnelle.
- Réponse automatisée à la reprise après sinistre (DR) : Les entreprises résilientes utilisent PagerDuty Automation pour automatiser le provisionnement et le basculement des environnements de reprise après sinistre et des applications uniques ou multiples. Les tests sont essentiels pour garantir que ces processus peuvent être exécutés rapidement et de manière fiable en cas de besoin et contribuent ainsi à soutenir le plan de continuité des activités d'une entreprise.
- Gestion des risques liés aux tiers liés aux TIC :
Les entreprises doivent mettre en œuvre des mesures rigoureuses pour évaluer et gérer les risques associés aux fournisseurs tiers critiques (CTTP) fournissant des services TIC.
-
- Surveillance des pratiques de réponse aux incidents : Si un CTTP utilise également PagerDuty Operations Cloud, l'institution financière peut demander l'accès aux rapports PagerDuty qui donneront un aperçu des pratiques de réponse aux incidents du CTTP, de leur réactivité aux incidents et de leur résilience opérationnelle globale.
- Classification et tests : Le PagerDuty Operations Cloud a été utilisé pour classer les incidents en fonction de l'origine tierce du problème. De plus, PagerDuty Automation a été utilisé pour exécuter des tests sur les CTTP afin de garantir leur disponibilité et leur robustesse.
- Partage d’informations, tenue de registres et documentation :
En vertu des réglementations DORA et UK, les institutions FinServ doivent conserver une documentation complète de leurs activités de gestion des risques informatiques, des rapports d'incidents et des résultats de tests. Cette documentation sera essentielle pour démontrer la conformité à ces réglementations lors d'audits potentiels. En outre, DORA encourage le partage d'informations entre les institutions financières et les autorités concernant les cybermenaces et les incidents. Cette approche collaborative vise à améliorer la préparation globale et les capacités de réponse au sein du secteur financier.
-
- Dépôt centralisé : PagerDuty est un « système d'action » et, comme mentionné ci-dessus, sert de référentiel centralisé immuable pour les données d'incident, y compris les détails d'activité horodatés, les journaux de communication et les étapes de résolution, tous rassemblés au cœur d'un incident. PagerDuty peut également s'intégrer et tenir automatiquement à jour le « système d'enregistrement » choisi par l'entreprise – les outils ITSM et ITOps. Cela simplifie et améliore la tenue des dossiers et démontre une approche documentée, reproductible et cohérente de la gestion des incidents.
- Rapports et analyses : Comme mentionné précédemment, PagerDuty offre des fonctionnalités d'analyse et de reporting qui peuvent générer des rapports sur les tendances des incidents, les temps de résolution et les performances de l'équipe. Ces rapports fournissent des informations basées sur les données qui peuvent orienter les efforts de remédiation technique ciblés et démontrer les efforts continus visant à améliorer la résilience opérationnelle.
- Pages d'état :Le partage d'informations est automatique et sans effort si les entreprises utilisent les pages d'état Web de PagerDuty, qui sont liées et alimentées directement par les incidents affectant les services commerciaux importants.
Conclusion
Espérons qu'il ressort clairement de ce qui précède que PagerDuty Operations Cloud est hautement applicable aux piliers fondamentaux de DORA et des réglementations britanniques :
Le PagerDuty Operations Cloud fournit un système d'action en temps quasi réel conçu pour vous aider à résoudre votre problème le plus rapidement possible tout en mettant simultanément à jour vos outils ITSM et de documentation. Il réduit le bruit et le travail des équipes des opérations et du NOC, leur permettant de passer d'une lutte réactive contre les incendies à une concentration proactive sur la résolution des problèmes. Il peut résoudre automatiquement les problèmes pour réduire les délais de résolution et fournir des analyses et des rapports post-incident inestimables pour vous aider à apprendre et à améliorer vos processus.
Enfin, il y a un point primordial qui mérite d’être souligné. Plus que toute autre chose, les régulateurs des services financiers souhaitent voir les entreprises réfléchir, documenter et investir dans leur stratégie de résilience opérationnelle. Investir et déployer PagerDuty est une indication claire que les institutions FinServ prennent la résilience opérationnelle au sérieux.
Si vous souhaitez plus de détails ou d'informations, s'il vous plaît contactez-moi .