Blog

Le travail acharné : un fléau qui continue de tourmenter les équipes d'ingénierie

par Damon Edwards 6 décembre 2022 | 6 minutes de lecture

Ce blog est une mise à jour d'un blog populaire rédigé par Damon Edwards.

Notre secteur a toujours eu des expressions locales pour désigner le travail nécessaire mais qui ne faisait pas avancer l'entreprise. Le mouvement SRE appelle ce type de travail « labeur ».

Le concept de travail est une force unificatrice car il fournit un cadre impartial pour identifier – puis contenir – le travail qui prend notre temps, empêche les gens de réaliser leur potentiel d’ingénierie et ne fait pas avancer l’entreprise.

Pourquoi le travail est important

Malheureusement, « pas assez de temps et trop de choses à faire » décrit les conditions de travail par défaut au sein des organisations opérationnelles. Il existe une réserve illimitée de travail planifié et non planifié : de nouvelles choses à déployer, des incidents auxquels répondre, des demandes d’assistance auxquelles répondre, des dettes techniques à rembourser, et la liste est longue.

Avec seulement quelques heures dans une journée, comment pouvez-vous être sûr que ce sur quoi vous travaillez fait réellement une différence ?

Comment vous assurer que votre équipe et votre organisation dans son ensemble optimisent les types de travail qui ajoutent de la valeur et trouvent des moyens d'éliminer le travail qui n'en apporte pas ? Après tout, les décisions prises par l'organisation et l'équipe déterminent la majorité de votre travail.

Pour maximiser la valeur de votre entreprise d’ingénierie et le potentiel humain de vos collègues, vous avez besoin d’un cadre objectif pour identifier et contenir le « mauvais » type de travail et maximiser le « bon » type de travail. Comprendre ce qu’est le travail pénible – et en contenir la quantité – apporte des avantages économiques à votre entreprise et améliore la vie professionnelle de vos collègues ingénieurs.

Quelle est la définition du travail ?

Google a été le premier à populariser le terme « labeur » et le mouvement SRE, qui a depuis été étendu aux opérations informatiques.

En un mot, SRE consiste à injecter des pratiques d'ingénierie logicielle - et un nouvel état d'esprit - dans les opérations informatiques pour créer des systèmes hautement fiables et hautement évolutifs. L'intérêt pour le sujet de SRE a explosé depuis que Google a publié son Livre sur l'ingénierie de fiabilité des sites .

Dans son livre, Vivek Rau donne une excellente définition : « Le labeur est le type de travail lié à la gestion d’un service de production qui a tendance à être manuel, répétitif, automatisable, tactique, dépourvu de valeur durable et qui évolue de manière linéaire à mesure que le service se développe. »

Plus une tâche possède ces attributs, plus vous pouvez la qualifier de « pénible ». Cependant, ce n'est pas parce qu'une tâche est considérée comme pénible qu'elle est frivole ou inutile. Au contraire, la plupart des organisations seraient paralysées si le travail n'était pas effectué.

En théorie, un objectif de « zéro labeur » semble intéressant. Mais en réalité, un tel objectif n’est pas atteignable dans une entreprise. Les entreprises technologiques sont en constante évolution et les nouveaux développements (attendus ou inattendus) entraîneront presque toujours du labeur. Ce n’est pas parce qu’une tâche est nécessaire pour apporter de la valeur à un client qu’elle est toujours source de valeur ajoutée. Le labeur peut être nécessaire à certains moments, mais il n’ajoute pas de valeur durable (c’est-à-dire un changement dans la perception de la valeur par les clients). À long terme, nous devrions vouloir éliminer la nécessité du labeur.

Le mieux que nous puissions espérer est de réduire efficacement les tâches fastidieuses et de les maintenir à un niveau gérable dans toute l'organisation. Les tâches fastidieuses proviendront de sources que vous connaissez déjà mais que vous n'avez pas eu le temps ou le budget d'automatiser (par exemple, les déploiements semi-manuels, les mises à jour/restaurations de schéma, la modification des quotas de stockage, les modifications du réseau, les ajouts d'utilisateurs, l'ajout de capacité, les modifications DNS, le basculement de service). Les tâches fastidieuses proviendront également d'un certain nombre de conditions imprévues qui peuvent provoquer des incidents nécessitant une intervention manuelle (par exemple, les redémarrages, les diagnostics, les contrôles de performances, la modification des paramètres de configuration).

Que devraient faire les gens au lieu de travailler dur ?

Au lieu que les ingénieurs passent du temps sur des tâches sans valeur ajoutée, vous voulez qu’ils consacrent le plus de temps possible à des travaux d’ingénierie à valeur ajoutée.

S’appuyant également sur les définitions utiles de Vivek Rau, le travail d’ingénierie peut être défini comme un travail créatif et innovant qui requiert un jugement humain, a une valeur durable et peut être exploité par d’autres.

Table of what constitutes "toil" and "engineering work"

Travailler dans une organisation où le rapport entre travail d'ingénierie et labeur est élevé donne l'impression que tout le monde nage vers un objectif. Travailler dans une organisation où le rapport entre travail d'ingénierie et labeur est faible donne plutôt l'impression de faire du surplace, au mieux, ou de couler, au pire.

Des niveaux élevés de travail sont toxiques

Le travail peut paraître inoffensif en petites quantités. Cependant, s'il n'est pas maîtrisé, il peut rapidement s'accumuler jusqu'à atteindre des niveaux toxiques pour l'individu et l'organisation.

Image of skull and cross bones with the word "toil"

Pour l’individu, des niveaux élevés de travail conduisent à :

  • Mécontentement et manque de sentiment d’accomplissement
  • Burnout
  • Davantage d'erreurs, ce qui entraîne des retouches fastidieuses pour les corriger
  • Pas le temps d'acquérir de nouvelles compétences
  • Stagnation de carrière (touchée par le manque d’opportunités de réaliser des projets à valeur ajoutée)

Pour l’organisation, des niveaux élevés de travail conduisent à :

  • Manque de capacité des équipes
  • Des coûts de soutien opérationnel excessifs
  • Incapacité à progresser sur les initiatives stratégiques (le syndrome « tout le monde est occupé, mais rien n’est fait »)
  • Incapacité à retenir les meilleurs talents (et à acquérir les meilleurs talents une fois que la nouvelle du fonctionnement de l’organisation se répand)

L’un des aspects les plus dangereux du travail est qu’il nécessite des travaux d’ingénierie pour l’éliminer.

La réduction du travail nécessite du temps d'ingénierie pour soit créer une automatisation de soutien afin d'automatiser le besoin d'intervention manuelle, soit améliorer le système pour atténuer le besoin d'intervention en premier lieu.

Les travaux d'ingénierie nécessaires pour réduire le travail consisteront généralement à créer une automatisation externe (c'est-à-dire des scripts et des outils d'automatisation en dehors du service), à créer une automatisation interne (c'est-à-dire une automatisation fournie dans le cadre du service) ou à améliorer le service pour ne pas nécessiter d'intervention de maintenance.

Le labeur absorbe le temps nécessaire pour effectuer le travail d'ingénierie qui permettra d'éviter de futurs labeurs. Si vous n'y prenez pas garde, le niveau de labeur dans une organisation peut augmenter à un point où l'organisation n'aura plus la capacité nécessaire pour l'arrêter. Si nous utilisons la métaphore de la dette technique, cela serait une « faillite technique ».

Visual illustration of toil at manageable percentage of capacity vs. unmanageable percentage of capacity

Le modèle de travail SRE, et tous les avantages qui en découlent, dépendent de la capacité des équipes à effectuer des travaux d'ingénierie. Cette exigence de capacité est la raison pour laquelle le travail acharné est un concept si central pour SRE. Si le travail acharné engloutit la capacité à effectuer des travaux d'ingénierie, le modèle SRE ne fonctionne pas. Un SRE perpétuellement enseveli sous le travail n'est pas un SRE, c'est juste un administrateur système traditionnel qui souffre depuis longtemps et qui a un nouveau titre.

Pourquoi PagerDuty se soucie du travail

L'un de nos principaux objectifs est d'améliorer la vie professionnelle des professionnels des opérations. Réduire le temps de travail et maximiser le temps d'ingénierie permet d'atteindre cet objectif.

Nos utilisateurs nous ont souvent montré comment ils utilisent PagerDuty Process Automation et Rundeck dans leurs efforts pour réduire le travail.

Les avantages comprennent :

  • Réduction des variations et des erreurs pour réduire le travail en standardisant les procédures.
  • Faciliter les travaux d'ingénierie tout en réduisant le travail pénible en automatisant les tâches qui nécessitaient auparavant beaucoup de travail.
  • Empêchez une équipe de créer du travail pour une autre équipe en activant le libre-service et en permettant aux autres d'effectuer eux-mêmes les tâches opérationnelles.

Contactez-nous pour en savoir plus sur PagerDuty Runbook Automation.