DERNIÈRES NOUVELLES
SÉLECTIONNÉ POUR VOUS
HEBDOMADAIRE
RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Le nouveau modèle Google Gemini intègre l'IA embarquée à la robotique

ParCollins J. OkothCollins J. Okoth
3 minutes de lecture -
Gemini réduit la taille de son introduction en bourse à 425 millions de dollars face à la prudence des marchés
  • Google a lancé un nouveau modèle de langage appelé Gemini Robotics On-Device.
  • Ce modèle permet d'exécuter des tâches localement sur des robots sans nécessiter de connexion internet.
  • L'entreprise technologique affirme que le modèle offre des performances proches de celles du modèle Gemini Robotics basé sur le cloud lors des tests de performance.

Google DeepMind a présenté mardi un nouveau modèle de langage appelé Gemini Robotics On-Device. L'entreprise a révélé que ce modèle peut exécuter des tâches localement sur des robots, sans connexion Internet.

Le nouveau modèle, qui s'appuie sur le précédent modèle d'IA Gemini Robotics de l'entreprise, lancé en mars, permet de contrôler les mouvements d'un robot. Google a également indiqué que le modèle vision-langage-action (VLA) est suffisamment compact et performant pour fonctionner directement sur un robot. Selon l'entreprise, les développeurs peuvent contrôler et paramétrer le modèle afin de répondre à différents besoins grâce à des commandes en langage naturel. 

La solution Robotics On-Device surpasse les autres modèles de Google

Carolina Parada, responsable de la robotique chez Google DeepMind, a affirmé que le modèle original de Gemini Robotics repose sur une approche hybride, lui permettant de fonctionner à la fois sur l'appareil et dans le cloud. Elle a précisé qu'avec le nouveau modèle fonctionnant exclusivement sur l'appareil, les utilisateurs bénéficient d'un accès aux fonctionnalités hors ligne quasiment identique à celui du modèle phare.

L'entreprise technologique affirme que son modèle offre des performances proches de celles du modèle Gemini Robotics basé sur le cloud lors des tests de performance. Google a également indiqué qu'il surpasse d'autres modes embarqués dans les tests de performance généraux, sans toutefois préciser lesquels. 

« Le modèle hybride de Gemini Robotics reste plus puissant, mais nous sommes vraiment surpris par latronde ce modèle embarqué. Je le recommanderais comme modèle d'entrée de gamme ou pour les applications souffrant de problèmes de connectivité. »

-Carolina Parada, responsable de la robotique chez Google DeepMind.

L'entreprise a présenté dans la démonstration des robots exécutant le modèle local, ouvrant des sacs et pliant des vêtements. Google a reconnu que, bien que le modèle ait été initialement entraîné pour les robots ALOHA, il a ensuite été adapté pour fonctionner sur un robot bi-bras Franka FR3 et sur le robot humanoïde Apollo d'tron.

L'entreprise technologique affirme que le robot bi-bras Franka FR3 a réussi à gérer des situations et des objets inédits, comme l'assemblage sur une chaîne industrielle. Elle précise que les développeurs peuvent présenter aux robots entre 50 et 100 démonstrations de tâches afin de les entraîner à de nouvelles missions grâce aux modèles du simulateur physique MuJoCo. 

Google DeepMind a également annoncé la publication d'un kit de développement logiciel (SDK) appelé Gemini Robotics. L'entreprise a révélé que ce SDK fournit l'ensemble des outils nécessaires à l'utilisation des modèles Gemini Robotics, notamment l'accès aux points de contrôle, le déploiement du modèle, son évaluation sur le robot et dans la simulation, le chargement des données et son paramétrage. Elle a précisé que son modèle Gemini Robotics embarqué et son SDK seront mis à la disposition d'un groupe de testeurs de confiance, tandis que Google poursuit ses efforts pour minimiser les risques liés à la sécurité.

Les entreprises technologiques se lancent dans la course à la robotique

D'autres entreprises utilisant des modèles d'IA s'intéressent également à la robotique. Nvidia développe une plateforme pour créer des modèles de base pour les humanoïdes. Son PDG, Jensen Huang, a souligné que la création de ces modèles de base pour les robots humanoïdes génériques est l'un des défis les plus passionnants à relever en IA aujourd'hui.

Huang a affirmé que le facteur humanoïde est actuellement l'un des sujets les plus controversés dans le monde de la robotique. Il a reconnu que ce domaine attire des investissements massifs en capital-risque, tout en suscitant un scepticisme considérable. 

Nvidia s'est également engagée en faveur de l'innovation robotique à travers des initiatives telles qu'Isaac et Jetson. En mars dernier, lors de sa conférence annuelle pour développeurs GTC, l'entreprise a rejoint la course aux humanoïdes avec le projet GROOT.

Nvidia a décrit sa nouvelle plateforme comme un modèle de base polyvalent pour les robots humanoïdes. L'entreprise a également indiqué que GROOT serait compatible avec les nouveaux matériels Nvidia. 

Hugging Face ne se contente pas de développer des modèles et des ensembles de données ouverts pour la robotique, elle travaille également sur des robots. L'entreprise a dévoilé en début de mois un modèle OpenAI pour la robotique appelé SmolVLA. 

L'entreprise affirme que son modèle, entraîné sur des ensembles de données partagés par la communauté, surpasse des modèles beaucoup plus volumineux pour la robotique, aussi bien dans des environnements virtuels que réels. Hugging Face a également révélé que SmolVLA vise à démocratiser l'accès aux modèles vision-langage-action (VLA) et à accélérer la recherche sur les agents robotiques généralistes.

L'an dernier, la société a lancé LeRobot, une collection de modèles, d'ensembles de données et d'outils dédiés à la robotique. Plus récemment, Hugging Face a fait l'acquisition de Pollen Robotics, une start-up française spécialisée en robotique, et a présenté plusieurs systèmes robotiques abordables, dont des humanoïdes, disponibles à la vente.

Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.

Partagez cet article
PLUS D'ACTUALITÉS
COURS ACCÉLÉRÉ CRYPTOMONNAIES
LES