John

Alerte , Meilleures pratiques et informations , Performance des opérations

Meilleures pratiques d'astreinte : contactez votre responsable

Avoir une seule personne de garde ne suffit pas. Que se passe-t-il si votre ingénieur de garde dort pendant son alerte ? Que se passe-t-il si la batterie de leur téléphone s'épuise sans qu'ils le sachent, ou s'ils reçoivent une alerte à un moment vraiment inopportun, comme lorsqu'ils sont coincés dans un bus ou dans les embouteillages ? Cela va arriver. Nous présentons les meilleures pratiques pour la sauvegarde. Une ou plusieurs personnes, attendant dans les coulisses, prêtes à passer à l'action si votre principal de garde n'est pas en mesure d'accomplir ses tâches au mieux de ses capacités à un moment donné.

Fiabilité

Se tenir sur les épaules de géants et trébucher avec eux – les statistiques « douloureuses » de la panne d'Amazon AWS

Aujourd'hui, vers 1 heure du matin, heure du Pacifique, Amazon a commencé à rencontrer des problèmes majeurs avec certaines de ses infrastructures cloud : en particulier avec ses offres EC2, EBS et RDS. Nous souhaitons partager quelques statistiques sur les alertes que nous avons envoyées - par téléphone ou SMS - pendant la panne.

3 minutes de lecture