Mettre en place la scalabilité dès les fondations
Le mot-clé de la montée en charge : scalabilité, autrement dit la capacité d’ajouter ou de libérer des ressources (serveurs, bases de données, stockage) en fonction de la demande.
- Scalabilité horizontale (scale out) : ajouter des instances pour répartir la charge (pratiqué massivement par les plateformes SaaS, et dans le cloud grâce au load balancing).
- Scalabilité verticale (scale up) : renforcer les performances d’une seule machine. Techniquement simple, mais atteint vite ses limites.
- Automatiser avec de l’autoscaling : ajustement en temps réel (AWS Auto Scaling, Azure VM Scale Sets, Google Cloud Autoscaler).
Le load balancing (répartition de la charge) est un indispensable, dès que plusieurs serveurs sont impliqués.
Un exemple frappant : lors des soldes 2023, certains sites e-commerce français, malgré une infrastructure cloud, ont vu des temps de réponse doubler à cause de l’absence de « green zones » (buffer de serveurs instanciés avant les pics, source : ZDNet France).