Google propulse l’IA dans le monde physique avec Gemini Robotics

Google DeepMind, déjà un acteur incontournable dans le domaine de l’intelligence artificielle, vient de franchir une étape majeure en entrant dans l’univers de la robotique. Avec l’annonce de Gemini Robotics et Gemini Robotics-ER, deux modèles basés sur le puissant système Gemini 2.0, la filiale de Google promet de transformer la manière dont les robots interagissent avec leur environnement et leurs utilisateurs. Décryptons ensemble cette avancée technologique qui pourrait bien redéfinir notre relation avec les machines.
Le modèle Gemini Robotics repose sur une combinaison unique de capacités en vision, langage et action. Contrairement à ses prédécesseurs ou concurrents, il ne se limite pas à interpréter des données visuelles ou des commandes textuelles : il peut également exécuter des actions physiques complexes.

Les éléments essentiels :
- Compréhension contextuelle : Gemini Robotics est capable d’interpréter des situations qu’il n’a jamais rencontrées au cours de son entraînement.
- Performance : Selon Google, ce modèle surpasse de deux fois les benchmarks de généralisation actuels pour les systèmes VLA.
- Polyglotte : Grâce à son intégration avec Gemini 2.0, il comprend des commandes en plusieurs langues, améliorant ainsi son interaction avec des utilisateurs diversifiés.
- Dextérité : Le modèle peut gérer des tâches complexes nécessitant une manipulation fine, comme plier du papier pour faire de l’origami ou insérer un snack dans un sac Ziploc.
Si Gemini Robotics est pensé pour être directement opérationnel, sa version dérivée, Gemini Robotics-ER, cible spécifiquement les développeurs et ingénieurs en robotique. Ce modèle met l’accent sur le raisonnement spatial et offre une solution clé en main pour contrôler des robots.
- Compatibilité étendue : Les roboticistes peuvent connecter Gemini Robotics-ER à leurs contrôleurs existants.
- Modules intégrés : Perception, estimation d’état, compréhension spatiale, planification et même génération de code sont inclus dans le package.
- Facilité d’intégration : L’objectif est de réduire les obstacles techniques pour permettre une adoption rapide par les professionnels du secteur.
Google ne s’aventure pas seul dans cette nouvelle ère. La firme collabore avec plusieurs acteurs majeurs du secteur :
- Apptronik travaille sur la conception de robots humanoïdes basés sur Gemini 2.0.
- Des entreprises renommées comme Boston Dynamics, Agility Robotics, et Enchanted Tools participent également aux tests et développements des capacités avancées de Gemini Robotics-ER.
Ces alliances visent à accélérer l’intégration des robots dans divers domaines, qu’il s’agisse d’applications industrielles, domestiques ou même médicales. Nous y reviendrons bien sûr lors du prochain Briefing.