Infrastruktur cloud menghabiskan waktu puluhan tahun untuk melayani manusia. Anda mengklik. Anda menggulir. Anda streaming. Pola yang dapat diprediksi. Membosankan, dalam arti yang baik. Agen AI? Binatang yang berbeda. Mereka bangun. Putar selusin sub-agen. Palu database, sobek dokumen, ping API. Lalu—poof —mereka pergi. Tidak meninggalkan apa pun kecuali jejak lalu lintas yang padat.
AWS menyadarinya. Pada hari Kamis mereka meluncurkan versi baru OpenSearch Serverless. Ini adalah penelusuran terkelola sepenuhnya dan database vektor yang dibuat khusus untuk beban kerja agen. Janjinya sederhana: skalakan secara instan ketika agen menjadi liar. Turun ke nol ketika mereka berhenti.
Infrastruktur lama mengasumsikan manusia berada di balik layar. Ini bohong sekarang. Industri teknologi menyadari bahwa sistemnya dirancang untuk audiens yang tidak lagi memegang kendali.
Pergeseran ini terjadi secara diam-diam namun agresif. Lalu lintas yang dihasilkan mesin bukan lagi minoritas. Cloudflare melaporkan bahwa bot menyumbang 31% dari seluruh lalu lintas HTTP dalam enam bulan terakhir. Seperempat dari itu? Perayap AI, alat pencarian, asisten.
“Lalu lintas non-manusia akan melebihi lalu lintas manusia…” sekitar awal tahun 2027, kata Lai Yi Ohlsen di Cloudflare kepada TechCrunch.
Pikirkan tentang tanggal itu. Tidak jauh. Konferensi I/O Google minggu lalu memberikan gambaran masa depan di mana Anda mendelegasikan tugas-tugas kehidupan ke AI—memesan penerbangan, meneliti pembelian. Namun perusahaan bergerak lebih cepat dibandingkan konsumen. Perusahaan mengerahkan agen secara internal. Di balik layar, lalu lintas mesin-ke-mesin memakan bandwidth.
Penyedia cloud punya masalah. Sistem yang dibangun sesuai keinginan manusia tidak dapat menangani agen otonom yang terus-menerus menggunakan alat dan mengambil data.
Itu sebabnya Tia White di AWS menyebut waktunya “mudah”. Agen bukan lagi eksperimen. Mereka sedang dalam produksi.
“Mereka melonjak tanpa peringatan. Mereka menganggur tanpa pemberitahuan,” kata White. “Perusahaan membutuhkan penelusuran yang terus berlanjut…”
Tanpa membayar udara kosong di antaranya.
Berikut perbaikan teknisnya: pisahkan komputasi dari penyimpanan.
Model lama tanpa server masih memerlukan satu instance agar tetap hidup. Penyimpanan dan komputasi direkatkan menjadi satu. Anda membayar untuk sebuah mobil yang berada di tempat parkir, baik Anda berada di dalamnya atau tidak. Versi baru AWS memisahkan keduanya. Hitung skala untuk memenuhi ledakan. Lalu hilang. Anda membayar $0.
“Ini seperti tempat parkir bermeter,” begitulah logikanya. Gunakan itu. Membayar. Meninggalkan. Pergi.
Pengembang tidak perlu mengambil tindakan apa pun untuk mengelola hal ini. OpenSearch Tanpa Server terintegrasi dengan Vercel dan Kiro. Anda menyebarkan backend. Mereka menangani infra.
Semua orang berlomba untuk menyelesaikan ini. Databricks dan Snowflake diubah namanya menjadi sistem memori untuk data perusahaan. Microsoft memperbarui Azure untuk berbagi memori antar agen selama lonjakan lalu lintas yang hebat tersebut. Cloudflare baru saja merilis pembaruan infranya bulan lalu. Sasaran yang sama: lingkungan yang persisten, skala instan.
Polanya jelas. Semakin banyak perusahaan yang melepaskan agennya, struktur internet lama akan rusak karena beban mesin. Kami harus mendesain ulang segalanya untuk mengakomodasi mereka.
Apakah ini akan membuat agen menjadi lebih murah? Mungkin. Lebih mudah untuk diukur? Niscaya. Namun kami menyaksikan pergeseran di bawah kami, lapisan demi lapisan server. Siapa yang tahu di mana jalan itu berakhir sekarang?
