Blog

Comment la propriété des services peut vous aider à accroître votre maturité opérationnelle

par Hannah Culver 1er novembre 2021 | 10 min de lecture

Gestion des opérations numériques Il s’agit d’exploiter la puissance des données pour agir au moment le plus important. Il s’agit également de disposer des processus et procédures appropriés pour soutenir les équipes lorsque chaque seconde est critique. Faire évoluer vos opérations numériques demande du temps, des itérations et de l’engagement. Le changement ne se fera pas du jour au lendemain. Mais si vous faites les efforts nécessaires, vous en tirerez des avantages considérables. Vous pourrez tirer des leçons des incidents et améliorer vos services de manière proactive au fil du temps.

Une façon d’améliorer la maturité de vos opérations numériques est d’adopter propriété du service Dans cet article de blog, nous partagerons ce qu'est la propriété du service, comment effectuer la transition une fois que votre organisation annonce le pivot et comment vos équipes gagneront en maturité au fil du temps.

Alors, qu’est-ce que la propriété du service ?

La propriété des services signifie que les personnes assument la responsabilité de la prise en charge des logiciels qu'elles fournissent à chaque étape du cycle de vie du logiciel/service. Ce niveau de propriété rapproche considérablement les équipes de développement de leurs clients, de l'entreprise et de la valeur fournie.

Les avantages de la propriété des services sont variés, mais voici quelques-uns des plus importants :

  • Vos équipes sauront qui est de garde et quand Cela les aide à se sentir plus en confiance lors des permanences et renforce la responsabilité des services qu'ils créent.
  • La fiabilité du service s'améliore . Lorsqu'une équipe se concentre sur un service particulier, les tendances sont plus faciles à repérer. Les problèmes de fiabilité apparaissent plus rapidement et les améliorations peuvent être priorisées.
  • Les clients subissent moins de dégradation de service et de temps d'arrêt Des clients plus satisfaits sont synonymes de réussite commerciale. Grâce à la gestion des services, vous pouvez réagir plus rapidement aux incidents et même les résoudre avant qu'ils n'aient d'impact significatif sur le client.

De nombreuses organisations optent pour la propriété des services afin d'innover plus rapidement et d'obtenir un avantage concurrentiel. La flexibilité de la propriété des services vous permet de vous orienter dans de nouvelles directions et de vous adapter rapidement aux changements. Mais ce n'est pas quelque chose qui peut être réalisé de manière isolée. La propriété des services fait partie d'un nouveau modèle culturel et opérationnel qui doit être adopté à l'échelle de l'organisation pour réussir. Voyons comment commencer.

Comment puis-je adopter la propriété du service ?

Comme tout changement de culture qui en vaut la peine, la prise en charge des services ne sera pas une initiative que vous pourrez mener à bien en un seul sprint. Et pour que cette initiative réussisse, il faudra que toute l'organisation évolue dans cette direction. Pour les besoins de cet article de blog, nous supposerons que votre organisation est prête à adopter la prise en charge des services et que votre équipe cherche la meilleure façon de procéder. Pour commencer, vous pouvez faire quelques actions.

  • Créer une liste de services . Si vous n'avez pas créé une liste de tous les services de votre système, travaillez de manière transversale avec d'autres équipes pour comprendre tous les éléments en mouvement. Même si vous souhaiterez éventuellement inclure les services métier, vous devez procéder étape par étape et vous concentrer d'abord sur ceux qui sont détenus par les équipes technologiques. Une fois que vous avez une liste de services, il est temps de commencer la partie « propriété ».
  • Définir l'équipe qui sera propriétaire du service Commencez par déterminer qui est responsable du service que vous définissez. Un service doit être entièrement détenu par l'équipe qui le prendra en charge via une rotation d'astreinte. Si plusieurs équipes partagent la responsabilité d'un service, il est préférable de diviser ce service en services distincts (si possible). Certaines organisations appellent cela la « mitose du service » : diviser une cellule en deux cellules distinctes, chacune ressemblant beaucoup à l'ancienne. Il existe plusieurs méthodes pour décider comment séparer les services, par exemple en les divisant en fonction de la taille de l'équipe ou du volume de code qu'elle gère. Vous pouvez en savoir plus sur la façon dont nous avons procédé sur PagerDuty.
  • Configurer la rotation d'astreinte pour ce service . Assurez-vous que les membres de l'équipe partagent la responsabilité de garantir la disponibilité du service en production. Créez des plannings d'astreinte qui font tourner les personnes et les intervenants de secours à une cadence régulière, ainsi que des politiques qui incluent des contacts d'escalade.
  • Assurez-vous que l'équipe est correctement dimensionnée Les services doivent être configurés de manière suffisamment précise pour que les membres de l'équipe puissent rapidement identifier la source des problèmes. Cela peut s'appliquer à la création d'un service dont la portée est si large que les connaissances nécessaires pour le prendre en charge dépassent ce que contient l'équipe. Mais cela s'applique également à la définition d'une portée trop restreinte pour une équipe. Par exemple, si deux microservices se comportent effectivement comme un seul et que la résolution d'un problème sur l'un implique également sa résolution sur l'autre, il peut être judicieux de les combiner.
  • Commencer petit Il est important de mettre en œuvre ce changement de manière progressive. De cette façon, vous pouvez rapidement démontrer votre réussite et inciter d'autres équipes à adopter cet état d'esprit. Cela donne également aux équipes le temps d'apprendre des autres avant de mettre en œuvre elles-mêmes la propriété du service. Idéalement, le changement devrait se dérouler plus facilement avec chaque équipe.

Au fur et à mesure que votre système évolue et change, veillez à ajuster les services, les équipes et les rotations d'astreinte en conséquence. Il ne s'agit pas d'une simple opération à mettre en place et à oublier. Vous devez plutôt vous attendre à ce que votre entreprise évolue au rythme de ses changements. Prévoyez du temps dans la planification trimestrielle pour comprendre comment votre équipe se porte. Si vous vous sentez dépassé, faites part de votre besoin de soutien supplémentaire. Les équipes doivent s'assurer que ce retour d'information est transmis aux responsables, et ces derniers sont responsables de faire remonter les informations en conséquence.

N'avons-nous pas besoin d'une documentation pour cela ?

Chaque service a besoin d'une documentation, aussi petite soit-elle. La documentation aide tout le monde à mieux comprendre ce qu'est le service et ce qu'il fait, comment il interagit avec d'autres services et ce qu'il faut faire en cas de problème. Dans cette optique, voici les points les plus importants à aborder lors de la création de la documentation.

Nommer et décrire :Les services les mieux nommés ne sont pas ceux qui sont nommés avec intelligence. Lorsque vous nommez un service, essayez de penser à la manière la plus simple et la plus descriptive de dire ce qu'il fait. Cela permet d'éliminer toute confusion à mesure que vous grandissez et évoluez. Assurez-vous que votre description est tout aussi informative. La description doit répondre à des questions telles que :

  • Quel est le but de ce service, de ce composant, de cette tranche de fonctionnalité ?
  • Comment cette chose apporte-t-elle de la valeur ?
  • A quoi cela contribue-t-il ?
  • S'il s'agit d'une fonctionnalité destinée aux clients, expliquez comment cela impactera les clients et comment cela s'intègre dans le composant commercial plus large.

Déterminer les dépendances :Les services ne fonctionnent pas en vase clos. Notre travail serait beaucoup plus facile si un problème dans un service était isolé et n'affectait aucun autre service. Pourtant, ce n'est plus le cas à mesure que nous évoluons vers les microservices. Vous devez savoir de quels services dépend le vôtre et quels services dépendent du vôtre.

À ce stade, il est extrêmement utile de créer un graphique de service qui montre à la fois les services techniques et commerciaux et la manière dont ils sont reliés les uns aux autres. Idéalement, il s'agirait d'un outil dynamique qui vous permettrait de comprendre comment une défaillance dans une partie du système affecte le reste du système dans son ensemble.

Au-delà de la cartographie de ces dépendances, vous devez disposer de plans de communication pour celles-ci. Comment allez-vous alerter les services dépendants en cas d'incident ? Comment allez-vous communiquer les problèmes techniques aux autres intervenants du secteur d'activité ? L'élaboration de ces plans à l'avance peut vous aider à envisager les incidents en termes de réponse de l'entreprise .

Livres d'exécution : Les cahiers d'exécution sont un outil important pour les équipes. Ils sont comme une aide-mémoire pour chaque service. Assurez-vous de documenter comment effectuer les tâches courantes et résoudre les incidents courants. Au fur et à mesure que vous vous familiariserez avec votre service, vous pourrez même inclure l'automatisation dans vos runbooks Cette automatisation peut aller des séquences avancées de correction automatique qui peuvent éliminer le besoin d'intervention humaine pour certains incidents, à la collecte de contexte légère et à l'exécution de scripts.

Quelle que soit l'étape à laquelle se trouvent vos runbooks, il est essentiel de les mettre à jour régulièrement. Si vous remarquez une erreur dans un runbook pendant la réponse, signalez-le et revenez-y plus tard. Les runbooks ne fonctionnent que s'ils reflètent l'état actuel. Prévoyez du temps et de l'espace pour maintenir ces ressources à jour.

Et n'oubliez pas que les manuels d'exploitation ne sont pas une solution miracle. Vous ne pouvez pas planifier et définir des instructions de résolution pour chaque incident. À mesure que votre système se développe, vous rencontrerez de nouveaux incidents. Un manuel d'exploitation est un outil, pas une solution miracle.

Comment puis-je savoir à quoi ressemble le succès ?

Le véritable succès vient de l'adoption par l'ensemble de l'organisation de la responsabilité des services. Cette initiative n'est jamais terminée, car les services, leurs besoins et leurs dépendances évoluent constamment. Cependant, vous pouvez utiliser des indicateurs pour comprendre les performances de votre service. Et vous pouvez parler à votre équipe et comprendre qualitativement ce qu'elle pense de ce changement.

Pour comprendre les performances des services, vous pouvez consulter divers outils. Tout d'abord, vous pouvez utiliser analytique pour comprendre à quel point il est bruyant, à quelle fréquence votre équipe est contactée et à quel moment ces interruptions se produisent. Cela peut vous donner une idée de la santé de votre service aux yeux de l'équipe qui le prend en charge.

Si vous souhaitez savoir comment votre service se comporte aux yeux de vos clients, il existe également un outil pour cela. SLO, ou objectifs de niveau de service , sont une mesure interne utilisée pour évaluer la fiabilité d'un service. Les SLO déterminent le nombre d'échecs qu'un service peut subir avant qu'un client ne soit mécontent et sont créés à partir des SLI (indicateurs de niveau de service).

Si vous respectez le niveau d'échec acceptable (également appelé marge d'erreur), votre service sera perçu par les clients comme fiable. Si vous ne respectez pas votre SLO, il est probable que vos clients ne soient pas satisfaits de vos performances.

Les SLO sont d'excellents outils pour évaluer la fiabilité des indicateurs et démontrer la valeur de la propriété des services. Mais ils ne constituent pas le seul moyen de mesurer le succès. Vous devez également parler à vos équipes pour comprendre leurs sentiments.

Un dialogue ouvert avec les équipes peut contribuer à renforcer la confiance et à accroître la sécurité psychologique. C’est extrêmement important, car vous rencontrerez des échecs en cours de route. Vous risquez de ne pas dimensionner correctement vos équipes au début de votre parcours et certains services pourraient manquer de soutien. Vous n’avez peut-être pas les bons objectifs de niveau de service et devez les réajuster. Quel que soit le défi auquel vous êtes confronté, vous devez rester irréprochable.

Ces obstacles signifient que vous apprenez et que vous vous améliorez. Si vous parvenez à les aborder avec une attitude positive et à écouter les propriétaires de services, vous améliorerez la fiabilité de vos services, de votre système dans son ensemble et le bonheur de vos équipes.

Quelle est ma prochaine étape ?

L'amélioration de la maturité de vos opérations numériques est un long chemin, mais qui en vaut la peine. C'est bénéfique pour votre équipe, les services que vous gérez et vos clients. Adopter un état d'esprit de propriétaire de service n'est pas le seul moyen d'apporter ces améliorations, mais c'est un élément clé.

Si vous souhaitez en savoir plus sur la propriété des services, vous pouvez Lisez notre guide d'opérations ou regardez ceci webinaire à la demande . Si vous souhaitez en savoir plus sur la planification de la maturité des opérations numériques, Découvrez notre eBook . Et si vous souhaitez voir comment PagerDuty peut vous aider à faire avancer des initiatives telles que FSO et la maturité opérationnelle, Essayez-nous gratuitement pendant 14 jours .