Le dépannage ne devrait pas poser autant de problèmes.
Saviez-vous que 85 % de la durée d'un incident typique est consacrée au diagnostic , impliquant au moins 4 ingénieurs ? L'objectif fondamental de la réponse aux incidents est de déterminer ce qui s'est passé et qui doit résoudre le problème le plus rapidement possible. Accélérer le diagnostic des problèmes vous permet d'atteindre le résolveur et la résolution beaucoup plus rapidement.
Le défi pour de nombreuses entreprises est que les données plus approfondies nécessaires pour établir des diagnostics précis sont verrouillées dans des environnements de production et nécessitent des spécialistes pour les extraire en raison de leurs connaissances, de leurs compétences et de leurs privilèges d'accès.
Pour répondre aux questions « Qu’est-ce qui s’est passé ? » et « Qui peut réparer ? », un premier intervenant doit faire appel en moyenne à au moins trois autres ingénieurs pour extraire des informations auxquelles eux seuls ont accès.
En fin de compte, trop de temps et trop d'heures de travail sont consacrés à la collecte répétée de données de diagnostic. L'automatisation de cette répétition accélérera le MTTR d'au moins 15 minutes et réduira les coûts et les interruptions d'au moins 50 %.
Laissez les intervenants s'occuper du dépannage, pas vos développeurs.
Voici un meilleur modèle de fonctionnement : automatisez vos procédures de dépannage les plus courantes pour vos intervenants dans PagerDuty et arrêtez de perturber le travail quotidien des ingénieurs experts avec la solution de diagnostic automatisé de PagerDuty.
Diagnostic automatisé permet de gagner du temps et d'éviter les interruptions tout au long d'un incident en permettant aux intervenants de trier efficacement les problèmes, en les transmettant uniquement aux ingénieurs capables de résoudre le problème. Les résolveurs disposent des données dont ils ont besoin et ces données de dépannage sont saisies dans le dossier de réponse à l'incident pour les rétrospectives futures.
Résoudre plus rapidement
Diagnostiquez et résolvez les incidents plus rapidement, tout en réduisant la consommation budgétaire liée aux erreurs.
Augmenter l'efficacité
Résolvez plus d'incidents avec 40 % d'escalades en moins et moins d'intervenants par incident.
Améliorer en continu
Automatisez davantage au fur et à mesure, en améliorant le MTTR de 25 minutes et en réduisant le travail tout en renforçant la capacité d'ingénierie.
Arrêtez l’escalade et commencez à atténuer
Les diagnostics automatisés aident les intervenants utilisant PagerDuty Incident Response à trier rapidement les incidents à l'aide de données introspectives provenant de services, ce qui n'était auparavant possible qu'en faisant appel à des experts du domaine. Les intervenants peuvent utiliser cette connaissance étendue pour trier et exclure d'autres possibilités parmi les dépendances et vérifier les faux positifs. Cela permet aux intervenants de faire remonter rapidement et efficacement au bon résolveur pour atténuer un problème et résoudre l'incident.
Mieux comprendre l'état actuel
Les émojis d’automatisation permettent à vos premiers intervenants, ainsi qu’à toutes les autres parties prenantes, de comprendre plus facilement quels services sont impactés/récupérés.
Invoquer l'automatisation d'une seule main
Bénéficiez d'une automatisation à la demande à partir de l'incident, utilisez des actions automatisées pré-approuvées et affichez les résultats de diagnostic sur un incident, le tout depuis l'application PagerDuty .
Automatisez les solutions de contournement pour réduire la gravité
Les diagnostics automatisés permettent aux clients de créer des processus d'atténuation automatisés tels que le déclenchement de basculements et de récupération après sinistre, ainsi que des processus de correction tels que le redémarrage des services. Les clients peuvent déployer de telles solutions de contournement en seulement une demi-journée pour réduire la gravité d'une panne jusqu'à ce qu'une solution plus permanente puisse être mise en œuvre.
Déclenchez des diagnostics de manière proactive avec Event Orchestration
En étant connecté à PagerDuty Event Intelligence, il est possible d'exécuter de manière proactive des tâches de diagnostic avant même que les intervenants ne soient avertis, afin qu'ils disposent des informations dont ils ont besoin lorsqu'ils reconnaissent un incident. Pour les cas bien compris, il est même possible de déclencher des solutions de contournement automatisées, éliminant ainsi le besoin de convoquer les intervenants si la correction automatisée résout l'incident.
Diagnostics automatisés pour AWS
Les diagnostics automatisés pour AWS dans PagerDuty fournissent des tâches de diagnostic prêtes à l'emploi fréquemment utilisées pour les services fréquemment utilisés, notamment Amazon CloudWatch, Amazon Lambda, Amazon EC2, Amazon ECS, Amazon ELB, Amazon RDS et Amazon VPC. Les clients peuvent facilement configurer ces tâches de modèle pour qu'elles fonctionnent dans leurs environnements spécifiques et étendre les étapes de diagnostic dans une définition de tâche pour les aider à démarrer immédiatement.
Comment ça marche
Lorsqu'un incident est généré dans PagerDuty, les intervenants peuvent invoquer des diagnostics à partir de l'infrastructure, des outils de surveillance, des fournisseurs de cloud, etc., automatiquement ou en cliquant sur un bouton.
Ces informations sont ensuite présentées dans PagerDuty dans un format utilisable par les premiers intervenants afin qu'ils puissent prendre des décisions plus éclairées sur la manière de commencer à résoudre l'incident ou sur la personne à appeler pour obtenir de l'aide.
Pack de solutions de diagnostic automatisé
L'ensemble de solutions de diagnostic automatisé PagerDuty comprend les éléments suivants :
- Actions d'automatisation PagerDuty . Un module complémentaire à PagerDuty Incident Response qui connecte en toute sécurité les utilisateurs finaux de PagerDuty à l'automatisation exécutée à distance.
- Automatisation du cahier des charges PagerDuty . Offre SaaS parfaitement connectée à PagerDuty via des actions automatisées.
- Intégrations de plugins avec 35 composants et services courants, permettant à leurs API d'être intégrées rapidement et en toute sécurité dans des flux de travail automatisés.
- Tâches de diagnostic prédéfinies fournissant des diagnostics communs pour les outils et services du système d'exploitation et de l'infrastructure
- Services de démarrage rapide pour la mise en œuvre et la personnalisation des diagnostics automatisés