Blog

Lancement de PagerDuty Operations Cloud à l'automne 2023

par Inga Weizman 30 octobre 2023 | 8 min de lecture

Dans le monde des affaires, 2023 a été qualifiée d’« année de l’efficacité ». Les organisations ont dû assurer davantage de croissance et d’innovation, mais avec des budgets et des effectifs plus serrés que les années précédentes. Les DSI ont dû élaborer des stratégies pour atténuer le risque d’échec opérationnel et protéger l’expérience client de leur marque. Ces forces ont conduit de nombreuses organisations à se tourner vers l’IA et l’automatisation pour augmenter la productivité à grande échelle, car la capacité à travailler de manière moderne et efficace est devenue un avantage concurrentiel.

Pour aider nos clients à obtenir cet avantage, PagerDuty est en train de lancer nouvelles fonctionnalités à travers le PagerDuty Operations Cloud qui rationalisent les processus opérationnels et les travaux critiques et non planifiés, le tout avec l'aide de IA et automatisation Ces nouvelles fonctionnalités d'AIOps, d'Incident Response et de Process Automaton permettent à nos clients de générer une croissance plus rapide, de réduire les coûts et de renforcer la confiance des clients.

Dans un souci d'efficacité, nous permettons à nos clients de consolider leurs outils et leurs ensembles de données à mesure qu'ils poursuivent leur transformation numérique. Lorsque les organisations fonctionnent efficacement, qu'il s'agisse d'une pile technologique, d'un flux de processus ou d'un budget, elles peuvent protéger les résultats de leur entreprise. et permettre à leurs équipes DevOps et SRE de se concentrer sur le travail le plus stratégique, le plus innovant et le plus épanouissant possible.

Plongeons dans ces nouvelles annonces et comment elles fonctionnent pour nos clients.

Boostez la productivité et l'innovation de votre équipe grâce à l'IA

Le moment est venu d'investir dans l'AIOps. AIOps : adoption croissante et meilleures pratiques rapport Selon IDC, « d’ici 2026, 90 % des DSI des grandes entreprises utiliseront des solutions AIOps pour prendre des décisions automatisées de remédiation et de répartition des charges de travail qui incluent des mesures de coût et de performance, améliorant la résilience et l’agilité ». En exploitant les capacités innovantes d’IA et d’AIOps de PagerDuty, les équipes peuvent réduire les interruptions globales de 87 %, ce qui leur permet de se concentrer davantage et d’être plus productives au quotidien. Cela signifie que les entreprises peuvent évoluer plus rapidement, développer davantage d’automatisation à l’échelle de l’entreprise et accélérer l’apprentissage, le tout avec des effectifs existants ou réduits.

Le bruit des alertes peut être extrêmement perturbant. Groupement d'alertes globales aide les équipes informatiques centralisées, telles que les centres d'opérations réseau et les experts SRE, à réduire davantage le bruit entre les services en regroupant les alertes en fonction d'ensembles de règles personnalisés. Cela aide les équipes à mieux comprendre la portée de l'incident, ce qui se traduit par des résolutions plus rapides et moins de temps d'arrêt, et laisse plus de temps pour l'innovation.

Même si de nombreuses organisations savent que l’automatisation est une nécessité, toutes ne savent pas par où commencer. Livres d'exécution générés par l'IA (version bêta publique) Aidez à créer rapidement davantage d'automatisation pour des processus opérationnels rationalisés. En utilisant le traitement du langage naturel (NLP), les invites textuelles sont transformées en scripts d'automatisation pour vous aider à démarrer et à créer davantage d'automatisation plus rapidement. Cela démocratise la création d'automatisation dans toute l'organisation pour les équipes d'exploitation informatique, de SRE et d'ingénierie de plateforme, et donne un coup de main aux utilisateurs moins expérimentés.

Mais les améliorations ne s’arrêtent pas après la résolution d’un incident, car les équipes les plus avisées apprennent et s’adaptent en permanence. Post-mortem d'incidents générés par l'IA (EA) Aidez à gagner du temps et à éliminer les tâches fastidieuses des autopsies. Les résumés générés par l'IA créent un rapport complet de ce qui s'est passé, quand, comment le problème a été résolu et les actions clés pour la prochaine fois. Cette nouvelle fonctionnalité collecte et rassemble automatiquement les données complètes sur les incidents afin que les équipes DevOps et SRE puissent se concentrer sur les enseignements tirés, au lieu des tâches fastidieuses consistant à copier et coller toutes les données liées aux incidents à partir des journaux, de Slack et des tickets.

En cas d'incident, il est essentiel de tenir les parties prenantes informées, mais cela prend également du temps et des ressources. Certaines organisations ont plusieurs personnes qui se consacrent uniquement aux mises à jour des parties prenantes lors d'incidents de grande ampleur. Mises à jour de statut générées par l'IA (EA) Les équipes peuvent générer des mises à jour de statut en quelques clics, ce qui facilite la communication avec les parties prenantes internes et les dirigeants. L'exploitation de l'IA générative pour les mises à jour de statut signifie que vous pouvez réduire le nombre de personnes dédiées aux mises à jour, ce qui réduit les coûts et libère du temps pour votre équipe. Les post-mortems d'incidents et les mises à jour de statut générés par l'IA aident vos équipes DevOps et SRE à mettre en œuvre et à maintenir systématiquement l'adoption des meilleures pratiques dans tous les services.

Augmentez l'efficacité opérationnelle grâce à l'automatisation pilotée par les événements pour déclencher une correction intelligente

Les DSI cherchent en permanence des moyens d’optimiser leurs processus opérationnels au nom de l’efficacité. La question n’est plus de savoir quand, mais comment tirer parti de l’automatisation dans l’ensemble de votre organisation. Selon Gartner, « d’ici 2027, 75 % des entreprises combineront leurs initiatives d’automatisation cloisonnées pour améliorer la valeur globale, ce qui représente une augmentation significative par rapport à moins de 10 % en 2022. » Les organisations adoptent de plus en plus l'automatisation dans leurs processus opérationnels globaux afin de pouvoir agir plus rapidement et d'avoir accès à des données pertinentes et exploitables en temps réel pour une meilleure prise de décision. Compte tenu de la quantité de données que les organisations traitent, il n'est plus efficace ni possible pour les humains de les trier manuellement. Elles ont besoin de la puissance de l'automatisation pour les aider à résoudre les problèmes plus rapidement avec peu ou pas d'intervention humaine. Lorsque des humains sont impliqués, ils doivent disposer de données pertinentes qui peuvent les aider à résoudre les problèmes plus rapidement.

La réponse aux incidents doit être hautement coordonnée, collaborative et standardisée. Lors de la gestion d'un problème critique, il n'y a pas de temps à perdre à rechercher des personnes, des données historiques ou des informations. Variables d'orchestration d'événements (EA) permet aux équipes SRE de créer une automatisation intelligente qui aide à informer d'autres outils et processus pour une réponse aux incidents plus rapide et plus ciblée qui peut être standardisée dans toute l'organisation pour une meilleure collaboration entre les équipes.

Les incidents ne sont pas toujours uniques ou rares ; en fait, nombre d’entre eux sont similaires par nature et se chevauchent en termes d’apprentissages et de connaissances institutionnelles pertinentes. Automatisation du Runbook PagerDuty permet à PagerDuty AIOps et aux intervenants humains de déclencher l'automatisation pour le diagnostic et la résolution des incidents bien compris. Tirer parti des synergies du module complémentaire Runbook Automation et d’AIOps aide résoudre les incidents jusqu'à 95 % plus rapidement en automatisant les tâches répétitives, en libérant du temps aux spécialistes et en permettant aux SRE, aux ingénieurs de plate-forme et aux architectes d'entreprise de se concentrer sur des incidents plus complexes. Le module complémentaire Runbook Automation prend également en charge les cas d'utilisation d'automatisation pour DevOps, ITSM, l'informatique en libre-service et l'automatisation pilotée par les événements. Cela aide les clients réduire les temps d'arrêt planifiés jusqu'à 85 % et les coûts de soutien peuvent atteindre 55 % .

Construire résilience avec une plateforme adaptée à votre façon de travailler

La vérité inconfortable est que « Tout échoue tout le temps. » Des incidents se produiront. Reconnaître cette réalité et s'y préparer est la façon dont vous pouvez atténuer le risque et la gravité de l'impact sur vos clients et vos équipes. En utilisant les données sur les revenus en ligne, Diablotin Selon les calculs, une seule minute d'indisponibilité pour un site de commerce électronique de premier plan peut coûter 200 000 $ ou plus en perte de revenus. Mais la responsabilité ne s'arrête pas là : si l'on considère l'impact négatif sur la marque, le coût total futur est bien plus élevé. Les entreprises qui trouvent des moyens de réduire l'impact des temps d'arrêt obtiendront en fin de compte un avantage concurrentiel en continuant à maintenir et à améliorer l'expérience client. Grâce à cette dernière série d'améliorations et de fonctionnalités, nous aidons nos clients à réduire leurs coûts et à tirer davantage de valeur et d'efficacité de leurs outils. Grâce à la flexibilité et à la personnalisation accrues, les clients peuvent mieux optimiser les processus opérationnels en fonction de leurs besoins.

Aujourd’hui, les organisations voient plus de données que jamais, ce qui peut être difficile à gérer en raison de leur nature dispersée entre divers outils et systèmes. L'extraction et la consolidation de ces données peuvent être un processus fastidieux. C'est pourquoi PagerDuty Analytics propose une solution prête à l'emploi Tableau de bord d'analyse (EA) et prévu E-mails d'analyse (aperçu client limité) , donnant une visibilité sur les performances de chaque métrique au fil du temps et les meilleurs benchmarks de sa catégorie, permettant un meilleur questionnement et facilitant la planification des incidents majeurs. Ils fournissent des indicateurs de performance et des données clés rationalisés aux bonnes parties prenantes pour les aider à améliorer continuellement l'efficacité opérationnelle de leurs équipes. Les clients qui ont recours aux analyses PagerDuty ont vu leur temps moyen d'accusé de réception (MTTA) s'améliorer de 28 %, ainsi qu'une répartition plus équitable du travail et des heures de réponse cohérentes, ce qui équivaut à une économie de 100 heures de travail par an et par équipe.

Les équipes DevOps, informatiques centrales ou SRE ont besoin de plus de flexibilité pour personnaliser leurs outils, tout en s'assurant d'utiliser les meilleures pratiques dans la mesure du possible, alors qu'elles continuent d'affiner leurs processus opérationnels. Améliorations du flux de travail des incidents permettent aux organisations de personnaliser leurs flux de travail tout en fournissant des modèles basés sur les meilleures pratiques du secteur pour une mise en route rapide. En réduisant les étapes manuelles grâce au déclenchement automatisé des processus de diagnostic et de correction à l'aide de Runbook Automation, les flux de travail des incidents contribuent à accélérer la résolution et à alléger la charge de travail des intervenants en cas d'incident

Les équipes mondiales et distribuées doivent collaborer efficacement lors d’incidents. Avec Slack/Chat comme méthode de contact (EA) , vous pouvez mobiliser rapidement une équipe d'intervention sans changer de contexte ni compter sur les SMS, qui peuvent être lents, peu fiables et coûteux. Cette nouvelle fonctionnalité se traduit par des économies de coûts pour les équipes mondiales qui peuvent utiliser le Wi-Fi au lieu de s'appuyer sur la couverture cellulaire. Elle permet également de gagner du temps et aux équipes de collaborer et de communiquer comme elles le souhaitent, avec une meilleure précision.

Nous avons également élargi notre partenariat avec Google Cloud et sommes un partenaire clé d'intégration dans Intégration de la santé des services personnalisés de Google Cloud. Il envoie des alertes proactives, personnalisées et détaillées sur les interruptions des services Google afin d'anticiper les problèmes affectant les clients. Le partenariat PagerDuty et Google Cloud offre une plate-forme essentielle pour des opérations cloud efficaces, aidant les clients à répondre aux perturbations et garantissant des expériences numériques fluides.

Commencez à utiliser ces nouvelles fonctionnalités

Le PagerDuty Operations Cloud aide nos clients à redéfinir le travail opérationnel critique avec une IA et une automatisation puissantes, afin qu'ils puissent réduire les coûts, innover plus rapidement, renforcer la résilience et faire évoluer leurs effectifs. Cette dernière version de la plateforme PagerDuty offre une plus grande flexibilité pour fonctionner comme les clients souhaitent tenir leur promesse de moins d'incidents et d'amélioration du temps moyen de résolution (MTTR).

Apprendre encore plus à propos de toutes ces nouvelles fonctionnalités intéressantes et inscrivez-vous pour Accès anticipé à nos capacités GenAI.