Blog

Modernisez votre environnement ITSM

par Twain Taylor 4 octobre 2017 | 7 minutes de lecture

Les exigences envers les organisations et leurs applications évoluent. La fiabilité est essentielle pour gagner la confiance des utilisateurs. Si une application subit une dégradation de service, sans parler d'une défaillance complète, temps d'arrêt Pendant une période prolongée, les utilisateurs chercheront une solution de remplacement parmi la variété de plus en plus large d’options. Dans de nombreux cas, les temps d’arrêt des applications peuvent également ternir la réputation de l’entreprise. Les gens apprécient beaucoup les applications fiables et finissent par les intégrer à leur travail ou à leur vie. Cela signifie que votre équipe DevOps doit réagir rapidement et résoudre les problèmes d’application qui ont un impact sur les clients. De longues périodes d’arrêt imprévues peuvent être embarrassantes et entraîner une perte d’utilisateurs.

Une transformation rapide a un coût

Développer une application moderne ou transformer une application existante peut entraîner des pannes. Les temps d'arrêt sont inévitables en raison du besoin constant de mise à jour et de transformation. Des architectures de plus en plus complexes peuvent introduire de nouvelles vulnérabilités.

Un Rapport IDC montre que les pannes d'infrastructure et les pannes d'application ont un impact énorme sur les entreprises du Fortune 1000. Chaque année, des milliards de dollars sont perdus en raison de temps d'arrêt imprévus. Outre les coûts tangibles, image de marque La performance de ces entreprises est également affectée. Si la satisfaction du client est importante, les temps d'arrêt des applications doivent être traités rapidement.

Traditionnellement, les organisations ont constaté qu’avoir un Processus ITSM en place contribue grandement à éviter les temps d'arrêt. Bien que cela soit vrai, les processus ITSM traditionnels ne vont pas très loin. Avec la complexité des applications et des pipelines de développement d'aujourd'hui, vous avez besoin d'un processus ITSM basé sur une paradigme des opérations modernes Ce qui fait obstacle aux opérations modernes, ce sont les rôles traditionnels des équipes de développement et d’exploitation.

L'histoire de deux équipes : les développeurs et les opérations

Il fut un temps où les développeurs et les équipes opérationnelles étaient deux entités distinctes. Les développeurs créaient une application et la confiaient à l'équipe opérationnelle pour qu'elle l'exécute et la maintienne, ce qui entraînait le chaos pendant les temps d'arrêt. L'équipe opérationnelle avait la charge de répondre aux temps d'arrêt, et les développeurs avaient tendance à supposer que c'était le problème de l'équipe opérationnelle de gérer tout ce qui venait après le développement, ce qui conduisait à l'écriture de code qui était moins susceptible d'être prêt pour la production.

Jetons un œil aux différentes caractéristiques d’une équipe de développeurs et d’une équipe d’exploitation :

Développeurs Opérations
Recherchez l'agilité Recherchez la stabilité
Sont exploratoires Sont réticents au risque
Non linéaire Séquentiel
Besoins commerciaux à court terme Besoins commerciaux à long terme

 

Les équipes d'exploitation et les équipes de développement fonctionnent à des vitesses différentes. Alors que l'équipe d'exploitation se concentre sur stabilité et fiabilité , les développeurs se concentrent sur la création de fonctionnalités de pointe et sur la manière de proposer quelque chose de nouveau. Cela signifie que les deux équipes ne sont pas au même niveau et que cela peut devenir chaotique en cas d'urgence et de temps d'arrêt.

Nous n’avons plus de place pour cette division. Dans le DevOps moderne, il est essentiel que les équipes de développement et d’exploitation travaillent en étroite collaboration et soient synchronisées. Les organisations informatiques ne peuvent pas se permettre d’accorder trop d’attention à l’une des parties, tandis que l’autre est négligée. Cela signifie que vous avez besoin d’une solution capable de répondre aux besoins des deux parties de manière aussi équitable que possible. Pour les organisations informatiques modernes, cette solution est DevOps.

DevOps est la seule méthode éprouvée permettant aux entreprises de concilier agilité et fiabilité. L'équilibre entre les deux sera bénéfique pour l'ensemble de l'entreprise et permettra des temps de réponse plus rapides en cas d'indisponibilité des applications.

Les trois piliers fondamentaux de DevOps : les personnes, les processus et les outils

DevOps consiste à intégrer les équipes Dev et Ops afin qu'elles puissent créer plus rapidement des applications de haute qualité. Si la rapidité est un objectif clé de DevOps, la qualité et la fiabilité sont tout aussi importantes.

Si une approche DevOps moderne est suivie, chacun des trois piliers fondamentaux aura des besoins spécifiques.

  • Personnes - En cas de panne, les équipes dispersées doivent avoir une réponse soigneusement orchestrée. Il doit y avoir une communication et une collaboration en temps réel entre les équipes pour agir rapidement et trouver la meilleure solution. Les équipes doivent toutes être responsables des performances du logiciel et de l'expérience client. La direction doit avoir la connaissance nécessaire pour déterminer la santé opérationnelle et la capacité de chaque équipe.
  • Processus - La réponse de l'équipe DevOps aux incidents doit être rationalisée conformément aux meilleures pratiques. Les approches aléatoires de lutte contre les incendies doivent être l'exception, et non la norme. La disponibilité des membres de l'équipe sur appel et la remontée des incidents aux équipes appropriées doivent être automatisées. L'automatisation des processus est essentielle pour obtenir de faibles MTTR (temps moyen de résolution). Il n'est pas viable de réinventer continuellement la roue ou de bricoler des processus manuels à chaque fois qu'il est temps de faire apparaître le bon contexte système, d'engager les bonnes personnes, etc.
  • Outils – Les outils doivent être étroitement intégrés les uns aux autres. Avec le flot d’informations typique des temps d’arrêt, les différents points de données doivent être intelligemment corrélés de manière à mettre en évidence l’impact sur les services, et les sources de données doivent alimenter des outils qui permettent des flux de travail agiles en temps réel

Les outils seuls ne sont pas la solution

La transition rapide vers une approche DevOps comporte ses propres défis. De nombreuses organisations tentent de réaliser cette transition en utilisant de nombreux outils. Cependant, les outils seuls ne sont pas la solution. Pour qu'une transformation en douceur se produise, vous devez aborder votre ensemble d'outils ITSM d'une manière non traditionnelle.

PagerDuty a mené une étude sur les organisations informatiques et a découvert qu'en moyenne, 47 % des organisations utilisent plus de 6 outils pour gérer leurs opérations. Pourtant, tous ces outils ne consolident que 27 % des alertes, et ces organisations ont un taux d'échec de 80 %. Cela montre que le simple ajout d'outils n'est pas la solution. En fait, cela ne fait qu'ajouter à la complexité.

Avec toutes les données et alertes provenant de nombreux outils, 85 % des équipes manquent des alertes importantes.

La réception simultanée de toutes ces informations complique le tri des informations les plus importantes à traiter. Surchargées d'informations, les équipes ont des problèmes de disponibilité pouvant atteindre 79 %. Un ensemble d'outils complexe a des répercussions sur vos collaborateurs et vos processus.

« Les équipes ont encore du mal à trouver le bon signal dans tout ce bruit. »

Pour répondre aux temps d'arrêt, il faut trouver la bonne solution et informer les bonnes personnes de ce qui se passe. Cela devient une tâche très difficile si vous ne savez pas quel est le problème exact et si vos outils deviennent frustrants à utiliser, au lieu de faciliter les choses.

Gestion des opérations numériques

La meilleure façon de Optimisez votre ensemble d'outils ITSM est en utilisant un Gestion des opérations numériques plate-forme comme PagerDuty. PagerDuty gère intelligemment les données d'alerte des plates-formes ITSM et de surveillance existantes que votre organisation utilise déjà, comme ServiceNow , permettant aux équipes de détecter les problèmes de manière proactive au lieu de simplement répondre aux tickets des clients. Le volume élevé de données générées par ces systèmes est centralisé dans une vue unique. Toutes les alertes non exploitables sont supprimées et ne sont pas notifiées (mais conservées pour aider à la détection des modèles et des anomalies), et l'automatisation engage de manière transparente les bonnes personnes en cas de problème. Les incidents contiennent toutes les alertes liées au problème (regroupées automatiquement via des algorithmes d'apprentissage automatique), ainsi que des données de performances et des journaux d'erreurs détaillés pour aider à un dépannage et une correction rapides. Une fois tout cela fait, PagerDuty fournit des rapports détaillés aux responsables des opérations pour analyser l'efficacité du système et l'agilité des employés. Lorsque vous effectuez la transition vers Modern Ops, un outil de résolution d'incidents comme PagerDuty est indispensable.

Découvrez comment PagerDuty peut vous aider à moderniser votre environnement ITSM en consultant les ressources suivantes :