Google Cloud parie gros sur les agents d’IA autonomes et la puissance informatique de nouvelle génération

8

Lors de la récente conférence Google Cloud Next, Google a signalé un changement stratégique majeur : aller au-delà des simples assistants d’IA vers un avenir défini par “l’IA agentique”. La société a dévoilé une suite de mises à jour conçues pour transformer le fonctionnement des entreprises, en se concentrant sur les agents autonomes et la puissance de calcul massive requise pour les faire fonctionner.

L’essor de « l’entreprise agentique »

Alors que Google indique que 75 % de ses clients utilisent déjà l’IA, l’entreprise cherche à dépasser l’intégration de base dans des outils comme Gmail ou Docs. Le nouvel objectif est la création de l’“entreprise agent”.

Contrairement à l’IA standard, qui nécessite une incitation humaine constante, l’IA agentique fait référence à des robots autonomes capables d’effectuer des tâches complexes en plusieurs étapes avec une supervision minimale. Cela représente une évolution significative dans l’industrie :
Des assistants aux acteurs : Au lieu de simplement rédiger un e-mail, un agent peut gérer un flux de travail, coordonner différentes applications logicielles et exécuter des tâches de manière indépendante.
Tendance du secteur : cela fait suite à un mouvement plus large parmi les leaders technologiques, notamment OpenAI et Anthropic, visant à faire passer l’IA d’un outil conversationnel à une main-d’œuvre fonctionnelle capable de gérer les processus de codage et d’administration.

Construire l’infrastructure : les agents d’entreprise Gemini

Pour gérer ce changement, Google Cloud présente la plate-forme d’agent d’entreprise Gemini. Cela sert de moteur nerveux central aux entreprises, leur permettant de superviser et de coordonner divers agents d’IA.

Les principales fonctionnalités de ce déploiement incluent :
L’application Gemini Enterprise : Une interface dédiée permettant aux employés d’interagir avec et de déployer l’IA.
Nouveau Agent Designer : Un outil qui permet aux utilisateurs de créer et de planifier des agents capables d’effectuer des tâches sur plusieurs applications métier différentes.
Sécurité et intégration : Le PDG Thomas Kurian a souligné que ces mises à jour visent à garantir que les agents sont connectés en toute sécurité aux systèmes de données internes d’une entreprise tout en optimisant les coûts et les performances.

Propulser l’avenir : les TPU de 8e génération

Les agents autonomes nécessitent une immense puissance de calcul. Pour répondre à cette demande, Google a annoncé deux nouvelles unités de traitement tenseur (TPU) de huitième génération, spécialement conçues pour les charges de travail d’IA de haute intensité.

Contrairement aux processeurs à usage général, ces puces sont spécialisées pour le gros du travail de l’intelligence artificielle :

1. La puce 8T (Formation)

Conçue pour la phase « d’apprentissage » de l’IA, la puce 8T est conçue pour rendre plus efficace la formation de grands modèles. Google affirme offrir trois fois la puissance de traitement de son prédécesseur, l’Ironwood de septième génération.

2. La puce 8I (inférence)

Conçue pour la phase « d’exécution », lorsqu’une IA répond réellement à un utilisateur, la puce 8I se concentre sur la vitesse et la mémoire. Il offre une amélioration de 80 % de la capacité de la mémoire SRAM et peut être étendu à des systèmes massifs contenant plus de 11 000 puces.


Résumé : Google tente de combler le fossé entre le potentiel de l’IA et la réalité de l’entreprise en fournissant à la fois les logiciels autonomes (agents Gemini) et le matériel spécialisé (TPU de 8e génération) nécessaires pour alimenter une main-d’œuvre numérique entièrement automatisée.