Les pubs vous déplaisent ? Aller Sans pub Auj.

SLA Math — Quel coût réel de 99,9% en heures de temps d'arrêt

Mis à jour le

99,9% son impressionnant jusqu'à ce que vous réalisez qu'il s'agit de 8,77 heures d'arrêt par an. Le tableau de calcul de disponibilité que chaque développeur devrait sauvegarder avant de signer un SLA.

Mathématiques SLA — Ce que la disponibilité 99,9% coûte réellement en heures de temps d'arrêt 1
ANNONCE · Supprimer ?

Imaginons cela : vous êtes en appel avec un client, il vous demande « 99,99% de disponibilité », vous dites d'accord, et vous passez à autre chose. Six mois plus tard, vous regardez une clause de crédit SLA et vous vous demandez comment vous êtes arrivés là. Cette garantie que vous avez acceptée de manière informelle autorise exactement 52 minutes de temps d'arrêt par an — et la plupart de ce temps disparaît lors d'un déploiement défavorable.

C'est la formule que chaque développeur devrait avoir en tête avant de signer un SLA ou de s'engager sur un nombre de disponibilité dans une proposition.

La Formule

Les pourcentages de disponibilité se convertissent en temps d'arrêt grâce à une formule simple :

Temps d'arrêt = (1 – disponibilité) x période

Pour une disponibilité de 99,9% : 1 – 0,999 = 0,001. Multipliez par le nombre de minutes dans une année (525 960) et vous obtenez 525,96 minutes — soit 8,77 heures de temps d'arrêt autorisées par an. Ce n'est pas une panne catastrophique. C'est une journée ordinaire où un déploiement s'effondre pendant quelques heures, une failover de base de données qui dure plus longtemps que prévu, et une mise à jour d'une dépendance en pleine nuit qui casse le service d'authentification. Huit heures passent très vite.

Le tableau de référence

Notez ce tableau. Chaque nombre est calculé de la même manière — (1 – disponibilité) multiplié par la durée de la période en minutes, puis converti en unité la plus lisible.

DisponibilitéTemps d'arrêt/jourTemps d'arrêt/semaineTemps d'arrêt/moisTemps d'arrêt/année
99%14,4 min1,68 h7,3 h87,6 h
99.5%7,2 min50,4 min3,65 h43,8 h
99.9%1,44 min10,08 min43,83 min8,77 h
99.95%43,2 s5,04 min21,92 min4,38 h
99.99%8,64 s1,01 min4,38 min52,6 min
99,999% (cinq neuf)0,864 s6,05 s26,3 s5,26 min

Relisez la ligne 99,999%. Cinq minutes et vingt-six secondes de temps d'arrêt autorisés par an. En total. Y compris les maintenances planifiées, les vérifications de santé échouées, et les 30 secondes que votre charge équilibreuse met pour remarquer un nœud mort. Vous pouvez faire le calcul sur ce que cela représente pour la plupart des équipes.

Ce que nécessite vraiment les cinq neuf

Les cinq neuf (99,999%) ne sont pas simplement « une infrastructure solide ». C'est une discipline d'ingénierie différente. Pour y arriver, vous avez besoin de :

  • Une redondance complète à chaque niveau — aucune pointe unique de défaillance nulle part dans la pile, y compris DNS, CDN, base de données et niveau d'application
  • Un redémarrage automatique avec détection en moins de secondes — les humains ne peuvent pas réagir rapidement assez ; vos systèmes de surveillance et de redémarrage doivent fonctionner sans intervention
  • Déploiements sans interruption — en bleu/vert ou en canary, avec retour automatique. Tout déploiement nécessitant un redémarrage consomme votre budget de 5 minutes
  • Des configurations actives en plusieurs régions — une seule région en panne ne peut pas vous emporter
  • Des maintenances planifiées en dehors des fenêtres SLA — la plupart des SLA 99,9% excluent explicitement les maintenances planifiées, mais les SLA 99,999% n'ont souvent pas de place pour cela

Les entreprises qui atteignent réellement 99,999% — AWS S3, Google Cloud Storage — disposent d'équipes dédiées à l'ingénierie de fiabilité, de données d'ingénierie du chaos, et d'un investissement en infrastructure qui ferait pâlir la plupart des fondateurs de SaaS. C'est réalisable, mais pas par hasard et pas à moindre coût.

Vous pouvez utiliser la Calculateur d'uptime / SLA pour effectuer ces conversions pour n'importe quel pourcentage de disponibilité et n'importe quelle fenêtre de temps que vous travaillez.

Le problème des crédits SLA

Voici la partie qui surprend les gens : les crédits SLA des fournisseurs de cloud ne vous compensent pas pour vos pertes réelles. Ils vous compensent pour une fraction de votre facture d'hébergement.

AWS, GCP et Azure offrent généralement 10 à 30 % de votre facture mensuelle en crédit lorsqu'ils violent leur SLA. Si vous payez 1 TP8T500 par mois pour EC2 et qu'ils ont une panne de deux heures qui viole l' SLA, vous pourriez obtenir un crédit de 1 TP8T50 à 150. En même temps, vous avez pu perdre des milliers de revenus, gaspiller des heures d'ingénieurs lors de la réponse à l'incident, et nuire à la confiance de vos clients.

Lorsque vous rédigez des SLA avec vos propres clients, comprenez que c'est le modèle standard — les crédits sont des gestes de bienveillance liés aux frais de service, et non une indemnisation complète. Lisez attentivement la clause des dommages. Beaucoup de clients d'entreprise essaieront de négocier une clause sur les dommages réels ; c'est une autre conversation qui implique des avocats, pas des SRE.

Les fenêtres mensuelles et annuelles importent

Les SLA sont mesurés sur une période spécifique, et cette période importe davantage que la plupart des gens ne le croient. Un SLA annuel de 99,9% vous donne 8,77 heures de temps d'arrêt réparties sur 12 mois. Un SLA mensuel de 99,9% vous donne seulement 43,83 minutes par mois — mais cela se réinitialise chaque mois.

Les clients veulent presque toujours une mesure mensuelle — cela semble plus strict, et cela leur donne du levier si vous avez un mauvais mois. Ce qu'ils ne réalisent pas toujours, c'est que la mesure mensuelle peut en réalité vous donner moins de marge totale : 43,83 minutes x 12 mois = 525,96 minutes par an, ce qui est exactement le même que le calcul annuel. La différence est que, avec des SLA mensuels, un mois défavorable peut déclencher une violation même si le reste de l'année a été parfait.

Lors des négociations, privilégiez les fenêtres annuelles autant que possible. Lorsque les clients exigent une mesure mensuelle, assurez-vous que votre infrastructure peut vraiment atteindre 99,9% chaque mois — pas simplement en moyenne sur l'année.

Ce que vous devez vraiment promettre

Voici les recommandations utiles :

Projets personnels et produits en phase initiale

99,% est honnête et acceptable. Neuf heures de temps d'arrêt par mois sont réaliste pour une petite équipe sans opérations dédiées. Ne promettez pas plus que ce que vous pouvez livrer de manière cohérente — le coût réputationnel d'une SLA non respectée est plus élevé que de fixer des attentes plus basses dès le départ.

SaaS B2B sur infrastructure cloud standard

99,9% est le cible appropriée. Avec une surveillance adéquate, une auto-échelle, des bases de données gérées, et un pipeline CI/CD qui ne nécessite pas de temps d'arrêt pour déployer, cela est véritablement réalisable sur AWS, GCP ou Azure sans effort exceptionnel. Le budget mensuel de 43 minutes est serré mais réalisable si vous avez une automatisation des déploiements.

99,99% et au-delà

Cela nécessite un investissement réel : des chargeurs répartis sur plusieurs zones de disponibilité, des configurations actives en plusieurs régions, une réplication de base de données avec promotion automatique, et quelqu'un qui considère la fiabilité comme son poste principal. Si un client demande 99,99% et que vous n'avez pas encore cette infrastructure en place, la réponse honnête est de négocier à 99,9% et de construire vers 99,99% comme un élément de roadmap — avec l'augmentation correspondante du coût de l'infrastructure reflétée dans le tarif.

99,999% est du domaine d'Amazon et de Google. Sauf si vous gérez des infrastructures financières, des systèmes de santé ou des services télécoms de niveau élevé avec une équipe dédiée de SRE, cela n'est pas un engagement réaliste.

Faites les calculs selon votre situation

Ce calcul s'applique à n'importe quelle fenêtre de temps et à n'importe quel objectif de disponibilité. Si vous travaillez avec une période SLA non standard — une fenêtre de 90 jours, un trimestre, une période de mesure personnalisée — la formule reste la même : multipliez le pourcentage de temps d'arrêt par le nombre de minutes dans votre fenêtre.

Le Calculateur de disponibilité / SLA sur IO Tools gère tout cela — insérez n'importe quel pourcentage de disponibilité et n'importe quelle période pour obtenir l'autorisation exacte de temps d'arrêt, utile lors de la rédaction de la langue SLA ou lors de la réponse à une demande de disponibilité du client avec une proposition réaliste.

En résumé : 99,9% est le seuil pratique pour la plupart des équipes sans investissement dédié en fiabilité. Tout au-delà de cela coûte de l'argent réel et nécessite des changements réels de processus. Connaître ce que vous engagez avant la signature du contrat.

Envie d'une expérience sans pub ? Passez à la version sans pub

Installez nos extensions

Ajoutez des outils IO à votre navigateur préféré pour un accès instantané et une recherche plus rapide

Sur Extension Chrome Sur Extension de bord Sur Extension Firefox Sur Extension de l'opéra

Le Tableau de Bord Est Arrivé !

Tableau de Bord est une façon amusante de suivre vos jeux, toutes les données sont stockées dans votre navigateur. D'autres fonctionnalités arrivent bientôt !

ANNONCE · Supprimer ?
ANNONCE · Supprimer ?
ANNONCE · Supprimer ?

Coin des nouvelles avec points forts techniques

Impliquez-vous

Aidez-nous à continuer à fournir des outils gratuits et précieux

Offre-moi un café
ANNONCE · Supprimer ?