DERNIÈRES NOUVELLES
SÉLECTIONNÉ POUR VOUS
HEBDOMADAIRE
RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Microsoft révolutionne le monde des robots grâce à un système de détection tactile

ParHania HumayunHania Humayun
4 minutes de lecture
Microsoft révolutionne le monde des robots grâce à un système de détection tactile.
  • Microsoft a lancé Rho-alpha fin janvier 2026, un modèle de robot utilisant des capteurs de vision, de langage et tactiles pour des tâches à deux bras.
  • Le système ajuste la prise en main en fonction d'un retour d'information physique que les caméras ne peuvent pas détecter, ce qui est utile pour insérer des fiches et monter des pièces.
  • Disponible via Microsoft Foundry pour permettre aux fabricants de la personnaliser pour les tâches de manutention répétitives.

Microsoft ResearchaFin janvier 2026, permettant aux machinesd'utiliserleurs mains tout en traitant les commandes vocales et les retours physiques. Ce système, baptisé Rho-alpha, marque l'entrée de l'entreprise sur le marché des plateformes pour robots bipèdes .

Cette technologie sera d'abord proposée à des groupes sélectionnés via un programme d'accès anticipé avant plus d'être disponible sur la plateforme Foundry de Microsoft. Les entreprises pourront ensuite adapter le système à leurs besoins spécifiques en utilisant leurs propres données.

Donner une dimension humaine à l'intelligence robotique

Les usines et les entrepôts recherchent des robots capables de s'adapter à des conditions changeantes plutôt que de répéter indéfiniment les mêmes mouvements programmés. Les hôpitaux ont besoin de machines quis'adaptentà différentes situations. Les chaînes de production où les articles varient d'un lot à l'autre posent des problèmes que l'automatisation traditionnelle ne peut résoudre efficacement. Microsoft a conçu Rho-alpha pour répondre à ce besoin en traitant les informations visuelles et auditives des robots, ainsi que les données physiques qu'ils perçoivent grâce à des capteurs.

La plupart des systèmes robotiques actuels s'appuient sur des caméras et des microphones pour appréhender leur environnement et exécuter des instructions. Rho-alpha ajoute une dimension supplémentaire en considérant le toucher comme tout aussi important. Lorsqu'une pince robotisée est équipée de capteurs de pression, le système reçoit des informations que les caméras ne captent pas. Ceci est crucial pour brancher un appareil ou assembler des pièces, car la vue seule ne permet pas de vérifier avec précision l'alignement.

Microsoft a démontré ces capacités à l'aide de deux bras robotisés Universal Robots UR5e équipés de capteurs de pression et de contact. Lors de tests avec le jeu de tâches BusyBox, les utilisateurs ont demandé au robot d' effectuer des actions telles que placer un plateau dans une boîte à outils et fermer le couvercle. Le système a traduit ces instructions en mouvements coordonnés entre les deux bras et a ajusté ses actions en fonction des informations captées par les capteurs. Lorsqu'une tentative d'insertion d'une prise échouait , un opérateur humain pouvait guider le robot à l'aide d'un dispositif d'entrée 3D, et le système a appris de ces corrections.

L'obtention de données d'entraînement suffisantes demeure le principal défi pour la conception de robots performants. Si les modèles de langage peuvent apprendre à partir d'immenses quantités de textes disponibles en ligne, l'entraînement des robots exige des démonstrations physiques concrètes, dont l'enregistrement est long et coûteux. Microsoft a résolu ce problème en entraînant Rho-alpha sur trois types d'informations : des enregistrements de démonstrations physiques réelles, des exercices simulés et de vastes ensembles de données d'images accompagnées de questions-réponses issues du web. L'entreprise utilise Nvidia Isaac Sim, hébergé sur des serveurs Azure, pour créer des scénarios synthétiques réalistes grâce à un processus d'apprentissage par renforcement.

Ce dispositif de simulation produit des situations d'entraînement physiquement réalistes qui complètent les démonstrations réelles. Cette approche combinée permet au modèledegérer les cas inhabituels et les situations de défaillance qui nécessiteraient autrement des milliers d'heures d'exploitation réelle pour être appréhendés.

La méthode d'entraînements'inspiredes approchesLesystèmeGeminiRobotics utilisées par d'autres entreprises du secteur de la robotique. de Google DeepMind, le modèle Helix de Figure AI pour les robots humanoïdes et Pi-zero de Physical Intelligence adoptent tous des approches similaires pour pallier le manque de données. Cette technique permet à ces systèmesd'acquérirdes compétences générales de manipulation sans nécessiter de démonstrations spécifiques pour chaque tâche qu'ils pourraient avoir à accomplir.

La concurrence sur un marché mature

Microsoft rejoint unmarché de la robotique en pleine expansion ces 18 derniers mois. Nvidia a lancé GR00T N1.6 , destiné aux robots humanoïdes et axé sur le contrôle global du corps et la compréhension du contexte. Google DeepMind a étendu Gemini à la robotique, avec des capacités allant du pliage de papier en origami à la manipulation de cartes à jouer. Physical Intelligence présente Pi-zero, un système polyvalent entraîné sur différents types de robots.

Rho-alpha se distingue par troisaspects. Premièrement, l'accent mis sur la perception tactile permet de résoudre les problèmes rencontrés par les systèmes reposant uniquement sur la vision. Deuxièmement, ce modèle est issu de la série Phi de Microsoft, optimisée par l'entreprise pour fonctionner efficacement sur du matériel grand public standard. De ce fait, il pourrait fonctionner sur des appareils locaux sans nécessiter de connexion permanente à des serveurs cloud. Troisièmement, l'apprentissage par les corrections humaines en situation réelle le différencie des modèles qui requièrent un réentraînement complet pour intégrer de nouveaux comportements.

L'approche commerciale de Microsoft diffère également decelle de sesconcurrents. L'entreprise prévoit de proposer Rho-alpha via sa plateforme Foundry, sous forme d'infrastructure que les fabricants et les intégrateurs de systèmes peuvent personnaliser avec leurs propres informations propriétaires. Cette approche est similaire à celle adoptée avec Azure OpenAI Service et cible les organisations souhaitant créer des versions spécialisées plutôt que d'utiliser un modèle générique.

Pour les fabricants et les entreprises de logistique, l' opportunité réside dans l'identification des tâches de manutention répétitives où l'automatisation actuelle atteint ses limites. Les stations de contrôle qualité, les opérations d'assemblage de kits et les lignes d'assemblage de petites séries sont autant de situations où la combinaison de compréhension du langage et de détection tactile de Rho-alpha pourrait réduire les besoins en programmation.

Le programme d'accès anticipé annoncé par Microsoft permet organisationsaux de vérifier si le système répond à leurs besoins avant d'investir dans une infrastructure de déploiement. Les entreprises doivent aborder ces évaluations en prévoyant qu'une supervision humaine sera nécessaire et prévoir des flux de travail où les opérateurs corrigent et guident les robots durant les phases d'apprentissage initiales.

physique L'IA marque une transition : les robots ne sont plus de simples outils programmés, mais de véritables collaborateurs flexibles. Cette transition s'opérera sur plusieurs années, mais les modèles fondamentaux développés par Microsoft, Nvidia et Google posent les bases qui définiront la defid'entreprise pour les dix prochaines années.

Il existe un juste milieu entre laisser son argent à la banque et miser sur les cryptomonnaies. Commencez par regarder cette vidéo gratuite sur la finance décentralisée.

Partagez cet article
PLUS D'ACTUALITÉS
COURS ACCÉLÉRÉ CRYPTOMONNAIES
LES