Internet viene ricablato per le macchine

26

L’infrastruttura cloud ha dedicato decenni al servizio degli esseri umani. Fai clic. Scorri. Tu trasmetti in streaming. Modelli prevedibili. Noioso, in senso buono. Agenti IA? Bestia diversa. Si svegliano. Metti insieme una dozzina di sub-agenti. Database Hammer, sfoglia documenti, ping API. Poi—puf —se ne sono andati. Non lasciando altro che una scia di traffico esploso.

AWS se ne è accorto. Giovedì è stata lanciata una nuova versione di OpenSearch Serverless. Si tratta di un database vettoriale e di ricerca completamente gestito creato appositamente per i carichi di lavoro degli agenti. La promessa è semplice: scalare istantaneamente quando gli agenti si scatenano. Scendo a zero quando si fermano.

La vecchia infrastruttura presuppone un essere umano dietro lo schermo. Questa è una bugia adesso. L’industria tecnologica si sta rendendo conto che i suoi sistemi sono stati progettati per un pubblico che non tiene più il volante.

Il cambiamento sta avvenendo in modo silenzioso ma aggressivo. Il traffico generato dalle macchine non è più una minoranza. Cloudflare riferisce che i bot hanno costituito il 31% di tutto il traffico HTTP negli ultimi sei mesi. Un quarto? Crawler AI, strumenti di ricerca, assistenti.

“Il traffico non umano supererà il traffico umano…” all’inizio del 2027, ha detto a TechCrunch Lai Yi Ohlsen di Cloudflare.

Pensa a quella data. Non lontano. La conferenza I/O di Google della scorsa settimana ha anticipato un futuro in cui delegherai i compiti della vita all’intelligenza artificiale: prenotare voli, fare ricerche sugli acquisti. Ma le imprese si stanno muovendo più velocemente dei consumatori. Le aziende stanno implementando agenti internamente. Dietro le quinte, il traffico da macchina a macchina consuma larghezza di banda.

I fornitori di servizi cloud hanno un problema. I sistemi costruiti per i capricci umani non sono in grado di gestire agenti autonomi che invocano costantemente strumenti e recuperano dati.

Ecco perché Tia White di AWS definisce i tempi “semplici”. Gli agenti non sono più esperimenti. Sono in produzione.

“Hanno picchi senza preavviso. Restano inattivi senza preavviso”, ha detto White. “Le aziende hanno bisogno di una ricerca che tenga il passo…”

Senza pagare per l’aria vuota nel mezzo.

Ecco la soluzione tecnica: disaccoppiare il calcolo dallo storage.

I vecchi modelli serverless richiedevano ancora un’istanza per rimanere in vita. Archiviazione e calcolo erano incollati insieme. Hai pagato per un’auto parcheggiata in un parcheggio, indipendentemente dal fatto che tu fossi al suo interno o meno. La nuova versione di AWS separa i due. Calcolare le scale per soddisfare l’esplosione. Poi svanisce. Paghi $ 0.

“È come un parcheggio a pagamento”, dice la logica. Usalo. Paga. Partire. Andare.

Gli sviluppatori non hanno bisogno di alzare un dito per gestirlo. OpenSearch Serverless si integra con Vercel e Kiro. Distribuisci i backend. Gestiscono gli infra.

Tutti stanno correndo per risolvere questo problema. Databricks e Snowflake stanno cambiando il marchio come sistemi di memoria per i dati aziendali. Microsoft ha aggiornato Azure per condividere la memoria tra agenti durante questi violenti picchi di traffico. Cloudflare ha appena rilasciato i propri aggiornamenti infra il mese scorso. Stesso obiettivo: ambienti persistenti, scalabilità istantanea.

Lo schema è chiaro. Man mano che sempre più aziende sguinzagliano gli agenti, la vecchia struttura di Internet si romperà sotto il peso delle intenzioni delle macchine. Dovremo riprogettare tutto per accoglierli.

Renderà gli agenti più economici? Probabilmente. Più facile da scalare? Indubbiamente. Ma stiamo osservando il terreno spostarsi sotto di noi, strato dopo strato di server. Chissà dove finisce la strada adesso?