DraftKings marque un touchdown avec PagerDuty

PagerDuty image

Taille: 1 000+

Industrie: Médias et divertissement

Emplacement: Boston, Massachusetts

Client depuis : 2013

DraftKings est une société de divertissement sportif numérique et de jeux qui alimente l'esprit de compétition des fans de sport. La société gère des sports fantastiques quotidiens, un bookmaker et un casino, offrant aux fans la possibilité de mettre leur peau dans le jeu en pariant sur leur équipe préférée.

Le marché du jeu en pleine croissance aux États-Unis entraîne une concurrence accrue. DraftKings s'efforce de créer les meilleures offres, les plus fiables et les plus centrées sur le client, tout en se développant rapidement sur de nouveaux marchés, comme une place de marché de jetons non fongibles (NFT). Josh Engels, directeur de la gestion des problèmes chez DraftKings, est chargé de fournir un environnement stable pour garantir la meilleure expérience possible aux fans. La priorité est de développer la résilience en fournissant un cadre de gestion des incidents aux équipes de DraftKings pour qu'elles puissent gérer leurs propres problèmes. « De nombreux changements se produisent en arrière-plan à mesure que nous grandissons rapidement et que nous nous développons sur de nouveaux marchés. Nous devons nous assurer que nous sommes stables et que nous offrons une excellente expérience client », a déclaré Engels.

Graphic that shows: Issues proactively identified by internal stakeholders is above 90%; Mean time to respond is under 30 minutes; A highly available platform translates to fan loyalty.

Attention aux pics de Gronk

Les week-ends de football constituent un test crucial pour la plateforme. Les jours de match, un flux constant d'utilisateurs de fantasy quotidiens choisissent leurs alignements avant le coup d'envoi. Dès que le premier touchdown se produit, DraftKings constate ce qu'ils ont appelé un « Gronk Spike ». Les fans ouvrent et actualisent leurs applications, doublant souvent le trafic de la plateforme et mettant à rude épreuve l'infrastructure. Pour éviter toute perte de revenus, l'entreprise doit garantir la disponibilité de la plateforme et une stabilité à toute épreuve dans le chaos constant des jours de match. « Le jeu est un marché hautement concurrentiel », explique Engels. « Si un client ne peut pas accéder à notre service, il se tournera immédiatement vers un concurrent. »

Au cours de ses premières années, DraftKings s’appuyait sur quelques personnes clés qui connaissaient son infrastructure pour surveiller activement les systèmes et résoudre les problèmes. Elles étaient attachées à leurs ordinateurs portables, les transportaient toute la journée et étaient souvent distraites par d’autres responsabilités. À mesure que l’entreprise se développait et que le nombre d’utilisateurs de la plateforme augmentait, le nombre d’équipes et de services augmentait également. Engels a déclaré : « Personne ne veut surveiller manuellement 24 heures sur 24 et 7 jours sur 7 dans un tableau de bord. Nous voulons être alertés lorsque nous devons être informés d’un incident. »

La complexité croissante de la gestion des technologies a entraîné une lassitude et un épuisement professionnel chez les ingénieurs. Il était difficile de trouver du temps pour travailler sur de nouveaux projets, des projets qui permettraient à DraftKings de garder une longueur d'avance sur la concurrence. Engels a expliqué : « Nous devons aider les équipes à comprendre pourquoi elles reçoivent des alertes et où se situent ces tendances, afin qu'elles puissent avoir plus de temps pour innover. »

Utilisation de PagerDuty pour rationaliser les opérations et générer des améliorations

Les équipes de DraftKings ont adopté une modèle de propriété des services , chaque ligne de produits étant responsable de l'écriture de son propre code et de son support en production. Ces équipes fonctionnaient selon le cadre de gestion des incidents de l'équipe de gestion des problèmes, avec PagerDuty comme Plateforme d'opérations numériques . PagerDuty a fourni une visibilité sur l'ensemble des systèmes et a permis à DraftKings de gérer rapidement les incidents et de réduire les problèmes récurrents.

DraftKings a intégré ses principaux systèmes de surveillance dans PagerDuty et a mis en place des calendriers et des politiques d'escalade. Les équipes n'ont plus besoin de transporter un ordinateur. Désormais, la bonne personne est avertie en cas de problème, ce qui offre aux équipes flexibilité et liberté. Engels a déclaré : « Avec PagerDuty, lorsqu'un service rencontre un problème, nous savons exactement qui doit le résoudre et où cette communication a lieu. Cela nous a permis de vraiment faire évoluer l'entreprise. »

Lorsque les équipes déploient des services, tout est lié à PagerDuty. Pour réduire le travail manuel et répétitif, un outil logiciel d'infrastructure en tant que code est utilisé pour la configuration initiale et l'intégration. Chaque fois qu'un nouveau service est déployé, il crée automatiquement un service dans PagerDuty et configure les intégrations spécifiques requises. Cela permet à DraftKings de standardiser listes de services dans PagerDuty. Engels a commenté : « Vous pouvez consulter PagerDuty et voir les services dont nous disposons et à qui ils appartiennent. Cela était difficile à maintenir dans une entreprise en pleine croissance. La clarté sur la propriété des services a été un autre énorme avantage de PagerDuty. »

Problem Management utilise PagerDuty pour assurer la stabilité et garantir la disponibilité du produit pour les clients. Les rapports PagerDuty fournissent des indicateurs permettant d'identifier les tendances, par exemple s'il y a beaucoup d'incidents liés à une fonctionnalité particulière. Les données sont utilisées pour communiquer avec l'entreprise, jusqu'au directeur technique, en fournissant des informations sur l'état de l'incident, le temps moyen de résolution et les accords de niveau de service. Engels a expliqué : « Les indicateurs nous permettent de prendre des décisions et d'apporter des améliorations dans toute l'organisation. »

Le manuel de jeu PagerDuty

DraftKings a implémenté PagerDuty pièces de réponse pour les incidents majeurs : situations dans lesquelles trop d'alertes arrivent pour qu'une seule personne puisse les gérer, ou plusieurs personnes reçoivent des alertes sur un problème. Par exemple, si Sportsbook a un incident majeur le dimanche de football, le jeu de réponse fera appel à un ingénieur clé avec une expertise commerciale sur l'ensemble de l'infrastructure en tant que commandant d'incident. Le jeu de réponse peut également créer une réunion de vidéoconférence spécifique à l'incident et les intervenants peuvent rejoindre le pont de conférence via PagerDuty. Cela permet une résolution rapide pendant les moments les plus critiques de DraftKing.

En cas de panne, DraftKings utilisera également des jeux de réponse pour alerter les clients le plus rapidement possible. L'équipe Customer Experience est informée et peut réagir immédiatement en affichant une bannière dans l'application et en diffusant des communications sur les réseaux sociaux. Cela améliore l'expérience des fans en les tenant informés de ce qui se passe. Alternativement, si un client est le premier à signaler un problème, l'équipe Customer Experience utilise PagerDuty intégration de courrier électronique pour créer un incident et notifier les bonnes équipes.

«PagerDuty nous aide à être informés des problèmes avant les clients… PagerDuty nous a vraiment rendus plus efficaces en tant qu'entreprise. »

– Josh Engels , Responsable de la gestion des problèmes chez DraftKings

Avantages avec PagerDuty

Avec PagerDuty, DraftKings a amélioré la résilience technique et la stabilité de la plateforme. Les ingénieurs n'ont plus besoin de transporter des ordinateurs portables et les pics de Gronk sont sous contrôle grâce à PagerDuty qui orchestre la bonne réponse, à chaque fois.

Depuis la mise en œuvre de PagerDuty, DraftKings a bénéficié de :

    • Expérience client et fidélisation. DraftKings gagne des fans sur un marché concurrentiel en maintenant une plateforme hautement disponible et en communiquant de manière proactive lorsque des problèmes surviennent.
    • Gestion des incidents. Le cadre de gestion des problèmes, y compris la plate-forme PagerDuty pour les opérations numériques et un modèle de propriété de service, garantit que la bonne personne est informée et peut résoudre rapidement les incidents.
    • Innovation. Les ingénieurs peuvent se concentrer sur le développement des gammes de produits sans être distraits et épuisés par la surveillance active de l’infrastructure.
    • Configuration flexible. En plus de l'intégration avec les systèmes de surveillance, les équipes peuvent également intégrer les outils utilisés pour leur gamme de produits spécifique et définir des calendriers et des politiques qui leur conviennent. Tout cela est rationalisé grâce à un logiciel d'infrastructure en tant que code.
    • Prise de décision basée sur les données : DraftKings utilise les rapports PagerDuty pour apprendre et améliorer ses opérations. Le MTTR est désormais inférieur à 30 minutes et les problèmes identifiés de manière proactive par les parties prenantes internes sont supérieurs à 90 %, ce qui représente une amélioration significative.
    • Communication améliorée. PagerDuty permet la communication au sein de l'entreprise pour une réponse rapide, y compris l'ingénierie, l'expérience client et les principales parties prenantes de l'entreprise.

DraftKings s'efforce d'offrir la meilleure expérience possible aux fans tout en restant compétitif et en captant le plus d'action de paris possible. Engels a déclaré : «PagerDuty nous aide à être informés des problèmes avant les clients. DraftKings a des exigences strictes en matière de disponibilité et de service, et dépasse désormais constamment ses objectifs. PagerDuty nous a vraiment aidés à devenir plus efficaces en tant qu'entreprise. »

Où placer le prochain pari ?

DraftKings continuera à donner la priorité à la santé de l'équipe. L'équipe de gestion des problèmes prévoit d'explorer les solutions de PagerDuty Renseignements sur les événements , notamment la réduction intelligente du bruit, pour minimiser le nombre d'alertes que les ingénieurs d'astreinte reçoivent lors d'un incident. En supprimant les interruptions, les intervenants peuvent se concentrer sur la résolution des problèmes encore plus rapidement, ce qui permet à DraftKings d'économiser du temps et de l'argent. En outre, l'entreprise a enquêté communication avec les parties prenantes pour fournir des informations sur l'état de l'entreprise et son impact en temps réel et réduire l'afflux de questions aux équipes d'ingénierie.

Pour en savoir plus sur la manière dont PagerDuty aide les entreprises à transformer leurs opérations numériques, visitez www.pagerduty.com/customers pour plus d'informations et Commencez un essai gratuit de 14 jours aujourd'hui .