L’infrastructure cloud a passé des décennies à s’occuper des humains. Vous cliquez. Vous faites défiler. Vous diffusez. Des modèles prévisibles. Ennuyeux, dans le bon sens du terme. Des agents IA ? Bête différente. Ils se réveillent. Faites tourner une douzaine de sous-agents. Martelez les bases de données, déchirez les documents, pingez les API. Puis—pouf —ils sont partis. Ne laissant rien d’autre qu’une traînée de trafic intense.
AWS l’a remarqué. Jeudi, ils ont déployé une nouvelle version de OpenSearch Serverless. Il s’agit d’une recherche entièrement gérée et d’une base de données vectorielles conçue spécifiquement pour les charges de travail agentiques. La promesse est simple : évoluez instantanément lorsque les agents se déchaînent. Tombez à zéro quand ils s’arrêtent.
Les anciennes infrastructures supposent un humain derrière l’écran. C’est un mensonge maintenant. L’industrie technologique se rend compte que ses systèmes ont été conçus pour un public qui ne tient plus le volant.
Le changement se produit discrètement mais de manière agressive. Le trafic généré par les machines n’est plus une minorité. Cloudflare rapporte que les robots représentaient 31 % de tout le trafic HTTP au cours des six derniers mois. Un quart de ça ? Robots d’exploration IA, outils de recherche, assistants.
“Le trafic non humain dépassera le trafic humain…” au début de 2027, a déclaré Lai Yi Ohlsen de Cloudflare à TechCrunch.
Pensez à cette date. Pas loin. La conférence I/O de Google la semaine dernière a évoqué un avenir dans lequel vous déléguerez les tâches de la vie à l’IA : réservation de vols, recherche d’achats. Mais les entreprises évoluent plus vite que les consommateurs. Les entreprises déploient des agents en interne. En coulisses, le trafic de machine à machine consomme de la bande passante.
Les fournisseurs de cloud ont un problème. Les systèmes conçus pour répondre aux caprices humains ne peuvent pas gérer des agents autonomes qui appellent constamment des outils et récupèrent des données.
C’est pourquoi Tia White d’AWS qualifie le timing de « simple ». Les agents ne sont plus des expériences. Ils sont en production.
“Ils augmentent sans avertissement. Ils restent inactifs sans préavis”, a déclaré White. “L’entreprise a besoin d’une recherche qui suit le rythme…”
Sans payer pour l’air vide entre les deux.
Voici la solution technique : découplez le calcul du stockage.
Les anciens modèles sans serveur nécessitaient encore une instance pour rester en vie. Le stockage et le calcul étaient collés ensemble. Vous avez payé pour une voiture garée sur une place de parking, que vous y soyez ou non. La nouvelle version d’AWS sépare les deux. Calculez les échelles pour faire face à l’éclatement. Puis il disparaît. Vous payez 0 $.
“C’est comme une place de stationnement payante”, dit la logique. Utilisez-le. Payer. Partir. Aller.
Les développeurs n’ont pas besoin de lever le petit doigt pour gérer cela. OpenSearch Serverless s’intègre à Vercel et Kiro. Vous déployez des backends. Ils s’occupent de l’infra.
Tout le monde se précipite pour résoudre ce problème. Databricks et Snowflake deviennent des systèmes de mémoire pour les données d’entreprise. Microsoft a mis à jour Azure pour partager la mémoire entre les agents lors de ces violents pics de trafic. Cloudflare vient de publier ses propres mises à jour infrarouges le mois dernier. Même objectif : environnements persistants, évolutivité instantanée.
Le modèle est clair. À mesure que de plus en plus d’entreprises recrutent des agents, l’ancienne structure Internet va se briser sous le poids des intentions des machines. Il va falloir tout repenser pour les accueillir.
Est-ce que cela rendra les agents moins chers ? Probablement. Plus facile à mettre à l’échelle ? Indubitablement. Mais nous observons le changement de terrain sous nos yeux, couche par couche de serveur. Qui sait où la route se termine maintenant ?





























