29/05/2026

Etudes & Enquêtes

[Expertises] 95 % de la puissance GPU payée par les entreprises est inutilisée

expertises, entreprises, études, IA

Cast AI, plateforme leader de l'automatisation cloud, publie son rapport « 2026 State of Kubernetes Optimization ». Cette analyse approfondie de l’utilisation des ressources (GPU, CPU, mémoire) au sein de clusters Kubernetes non optimisés révèle que, malgré leur coût élevé, les GPU sont largement sous-exploités.

L’étude montre que les gains d’efficacité attendus de Kubernetes ne se matérialisent pas automatiquement avec la croissance des infrastructures. Cela creuse l’écart entre les factures cloud des entreprises et leur consommation réelle.

Kubernetes progresse, l’efficacité stagne

Alors que l’adoption de Kubernetes s'accélère dans tous les secteurs, l’optimisation des ressources suit la trajectoire inverse. En 2025, l’utilisation moyenne des CPU au sein des clusters n’était que de 8 %, tandis que celle de la mémoire s'élevait à 20 %.

L’IA aggrave le gaspillage des ressources

L'essor rapide de l'IA accentue le problème avec la multiplication des nœuds équipés de GPU. Pourtant, les données révèlent le même paradoxe que pour le calcul classique : l’utilisation des GPU n’a pas dépassé 5 % en moyenne sur les clusters analysés. Pour les entreprises investissant massivement dans l'IA, cela représente un surcoût majeur et souvent invisible.

Sans une véritable stratégie d'optimisation, ce gaspillage deviendra l’un des postes de dépenses les plus lourds de l'infrastructure cloud moderne.

L’ajustement ponctuel ne suffit plus

L’étude remet en cause une croyance répandue : la conviction que la configuration d’un cluster est une tâche ponctuelle effectuée lors du déploiement. Or, un ajustement des ressources (rightsizing) réalisé une fois pour toutes est inefficace. Les charges de travail fluctuent et les besoins évoluent : une configuration optimale il y a six mois est aujourd’hui dépassée.

Qu’il s’agisse du choix des instances Spot, de l'autoscaling ou de la gestion des engagements, chaque paramètre varie dans le temps et dépasse désormais les capacités de gestion manuelle à grande échelle.

« Laisser un GPU inactif coûte plusieurs dollars par heure, contre quelques centimes pour un CPU. Pourtant, 95 % de la capacité GPU reste inutilisée. Avec une hausse de 15 % du prix des instances H200, qui met fin à vingt ans de baisse constante des coûts, le problème n’est plus technique. L’optimisation autonome devient une nécessité face à une économie du Cloud moins favorable », déclare Laurent Gil, Cofondateur et président de Cast AI.

Articles en relation

Derniers articles parus
Les plus lus