DeepMind : avancée majeure dans la robotique intelligente

Avec Gemini Robotics 1.5, Google DeepMind entent faire entrer les agents d’IA dans le monde physique.

DeepMind a annoncé le 25 septembre une avancée majeure dans la robotique intelligente. L’objet:  le lancement de Gemini Robotics 1.5. Un modèle vision-langage-action (VLA) capable de traduire des instructions visuelles et textuelles en commandes motrices robotisées.

Aux côtés de Gemini Robotics-ER 1.5, un modèle de raisonnement incarné (embodied reasoning) dédié à la planification et à la prise de décision, cette architecture en binôme permet aux robots non seulement d’agir, mais aussi de penser avant d’agir. Gemini Robotics-ER 1.5 élabore des stratégies à plusieurs étapes. Et communique ses décisions en langage naturel. Tandis que Gemini Robotics 1.5 exécute les actions avec conscience contextuelle et transparence opérationnelle.

Ces modèles combinés permettent aux agents robotiques de généraliser leurs connaissances à différents corps robotiques (embodiments). Sans adaptation manuelle. Ce qui accélère l’apprentissage et l’extension de leurs capacités. Par exemple, des compétences apprises sur le robot ALOHA 2 ont été transférées avec succès au robot Apollo d’Apptronik (en photo). Ou au robot bi-bras FRANKA. Illustrant la robustesse de cette approche.

Google DeepMind fait entrer les agents d’IA dans le monde physique

 

Google DeepMind met dès à présent Gemini Robotics-ER 1.5 à disposition des développeurs via l’API Gemini de Google AI Studio. Tandis que Gemini Robotics 1.5 est accessible à des partenaires sélectionnés. Conçu pour la sécurité et l’alignement avec des principes éthiques, le système intègre des mécanismes de raisonnement sémantique sur la sécurité, dialogue respectueux avec l’humain et systèmes embarqués de prévention des collisions. DeepMind publie également une version enrichie du benchmark ASIMOV, dédiée à l’évaluation de la sécurité sémantique.

Avec Gemini Robotics 1.5, DeepMind franchit une étape décisive vers l’intelligence artificielle généralisée incarnée (AGI physique), ouvrant la voie à des robots autonomes capables de naviguer, raisonner et agir dans le monde réel avec flexibilité et intelligence.

Partagez cet article

Laisser un commentaire

Retour en haut