Blog

Moins c'est plus avec une réponse intelligente et l'automatisation

par Ariel Russo 24 juin 2020 | 5 minutes de lecture

Pour le meilleur ou pour le pire, nous sommes devenus une société obsédée par l’efficacité. On en trouve des traces dans tous les aspects de notre vie, des applications bancaires numériques et de commerce électronique aux thermostats et sonnettes intelligents. Pourtant, malgré le fait que nous ayons recours à l’automatisation dans presque tous les aspects de notre vie personnelle, une étude conjointe Une étude menée par PagerDuty et Dimensional Research a révélé qu'en revanche, 90 % des entreprises disposent de peu ou pas d'automatisation pour la résolution des problèmes Cela soulève la question : puisque nous utilisons l’automatisation quotidiennement dans notre vie personnelle pour rendre les choses simples plus faciles, pourquoi ne l’utilisons-nous pas également au travail ?

Travaillez plus intelligemment, pas plus dur

Bien qu'ils soient surnommés les « gourous de la technologie » au sein de leurs propres entreprises, vous seriez surpris de voir combien de professionnels de l'informatique ont recours à des processus manuels fastidieux pour accomplir leur travail.

De nombreuses équipes informatiques n'utilisent pas au mieux leur temps ou leurs ressources. Au lieu de cela, elles se contentent de parcourir un manuel pour déterminer comment réagir à un problème ou de passer au peigne fin manuellement les incidents passés pour voir ce qui pourrait être lié. Cependant, l'un des moyens les plus simples d'améliorer l'efficacité des équipes et de protéger les revenus consiste à mettre en place une réponse et une automatisation intelligentes, qui incluent l'automatisation des procédures répétables afin de pouvoir réaffecter des ressources précieuses ailleurs.

Nos dernières améliorations de la Lancement de produit au printemps 2020 Les équipes d'intervention d'urgence abordent la réponse intelligente et l'automatisation de trois manières : (1) en coordonnant les personnes et les processus, (2) en fournissant aux équipes d'intervention le contexte et les informations appropriés lorsqu'elles en ont besoin et (3) en mettant à leur disposition une automatisation facile à utiliser afin qu'elles puissent rapidement diagnostiquer et résoudre les problèmes. Examinons de plus près son fonctionnement.

Plongée en profondeur dans l'innovation

Triage intelligent

Dans le cadre de Renseignements sur les événements PagerDuty et maintenant disponible sur mobile, Triage intelligent empêche les équipes de dupliquer le travail. Vous pouvez désormais utiliser la fonctionnalité Incidents associés pour établir une source unique de vérité pour les incidents qui affectent plusieurs équipes. Les incidents associés étendent les capacités d'apprentissage automatique d'Event Intelligence au-delà de la réduction du bruit et fournissent aux intervenants des informations contextuelles en temps réel sur l'ensemble des services.

En examinant les incidents simultanés sur d'autres services qui pourraient être liés au problème en question, les intervenants peuvent mieux comprendre l'ampleur et la portée de l'impact, éviter les communications redondantes et s'assurer que les équipes ne se marchent pas dessus lorsqu'elles tentent de résoudre les problèmes. Intelligent Triage utilise l'apprentissage automatique qui permet de :

  • Voir ce qui se passe tout de suite dans toute l'entreprise
  • Comprendre si le problème est local ou impacte les autres
  • Recrutez le bons coéquipiers et travailler ensemble pour résoudre le problème
  • Améliorer Temps moyen de réaction

Incident de réouverture

Il arrive parfois que les intervenants ferment accidentellement un incident au cours d'une intervention, même si l'incident n'a pas été résolu. Il arrive également qu'ils résolvent un incident majeur en supposant que l'incident est terminé, mais qu'ils remarquent peu de temps après des symptômes persistants découlant de la même cause via d'autres canaux tels que la surveillance et le support client.

Ce n'est pas grave, des erreurs se produisent ! Nous sommes tous humains. C'est pourquoi PagerDuty a publié une nouvelle fonctionnalité (disponible en accès anticipé) qui permet aux intervenants de rouvrir les incidents sans déclencher de nouvelles alertes. Cette action simple mais importante augmente la flexibilité des intervenants, réduit la duplication des incidents et facilite et accélère la remobilisation des équipes d'intervention si les symptômes d'un incident majeur sont réapparus. Vous pouvez également reproduire des actions de réouverture simultanées dans des outils adjacents comme ServiceNow dans PagerDuty.

Intégrations d'automatisation du livre d'exécution

Une autre façon d’obtenir des résultats rapides consiste à automatiser toutes les procédures manuelles ou partiellement automatisées que vous avez capturées dans des « runbooks » opérationnels et à les connecter à vos processus automatisés et intelligents de réponse aux incidents. Nos intégrations récemment publiées avec Pont roulant , Ayehu , et Souple pour l'automatisation du livre d'exécution, en plus de notre intégration existante avec Amazon EventBridge —vous permet d'automatiser les flux de travail de réponse informatique manuels et d'améliorer la communication et la vitesse de résolution au sein des équipes de réponse.

Voyons un exemple de la manière dont la réponse aux incidents à l'aide de l'automatisation du livre d'exploitation de l'intégration Rundeck pourrait se dérouler :

Votre entreprise de commerce électronique est en pleine période de pointe et votre serveur tombe en panne, ce qui empêche les clients de payer et d'acheter des articles dans leur panier. PagerDuty a alerté les bonnes personnes qu'il y a un incident.

Et maintenant ? Comment permettre à vos intervenants d'agir rapidement pour diagnostiquer et résoudre l'incident ? S'ils doivent faire remonter l'incident à un collègue ou à une autre équipe, vous perdez du temps. S'ils doivent naviguer sur un wiki ou fouiller dans des manuels d'exploitation, vous perdez du temps.

Donnez plutôt à vos intervenants un accès sécurisé et en libre-service aux procédures opérationnelles automatisées dont ils ont besoin pour agir. L'automatisation du livre de procédures de Rundeck permet à n'importe lequel de vos intervenants d'exécuter des procédures de diagnostic ou de réparation en toute sécurité, tout comme le feraient vos experts en la matière, afin que vos incidents soient plus courts et nécessitent moins d'escalades.

Prête à l'emploi, l'intégration entre Rundeck et PagerDuty vous permet :

  • Déclencher automatiquement les tâches Rundeck au début d'un incident PagerDuty (par exemple, en démarrant des diagnostics ou en essayant des actions de réparation avant même que le premier intervenant ne se connecte à PagerDuty)
  • Déclenchez des tâches Rundeck lors d'un incident à l'aide d'actions personnalisées dans l'interface utilisateur Web ou mobile de PagerDuty .
  • Faites en sorte que vos tâches Rundeck mettent automatiquement à jour les notes/chronologies d'incident dans PagerDuty
  • Déclencher un incident PagerDuty si une tâche Rundeck échoue

Dans ce scénario, l’utilisation de l’automatisation du livre d’exécution aide l’entreprise de commerce électronique à déployer ses ressources plus efficacement, à améliorer le MTTR et à protéger encore plus de revenus contre la perte résultant de la panne.

Faites de la réponse intelligente et de l'automatisation une réalité

Ces innovations allègent la charge de travail des intervenants en réduisant la duplication du travail et en permettant aux machines d’automatiser les tâches manuelles. En donnant aux équipes la possibilité de faire plus avec moins, PagerDuty aide les organisations à améliorer leur résilience et à protéger les relations avec leurs clients et les revenus durement gagnés.

Si votre organisation pourrait bénéficier de l’un de ces outils, n’hésitez pas à consulter notre essai gratuit ou contactez votre gestionnaire de compte pour organiser une démonstration personnalisée.