ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

La svolta di Microsoft affronta i limiti dei robot con un sistema di rilevamento tattile

DiHania HumayunHania Humayun
Tempo di lettura: 4 minuti.
La svolta di Microsoft affronta i limiti dei robot con un sistema di rilevamento tattile.
  • Microsoft ha lanciato Rho-alpha a fine gennaio 2026, un modello di robot che utilizza sensori visivi, linguistici e tattili per svolgere compiti a due braccia.
  • Il sistema regola la presa in base al feedback fisico che le telecamere non riescono a rilevare, utile per inserire spine e montare componenti.
  • Disponibile tramite Microsoft Foundry per consentire ai produttori di personalizzare le attività di gestione ripetitive.

Microsoft Researchhalanciato un nuovo sistema di controllo per robot che permette alle macchinedi lavorarecon le mani elaborando comandi vocali e feedback fisici. Il sistema, chiamato Rho-alpha, segna l'ingresso dell'azienda nello sviluppo di modelli di base progettati per robot che utilizzano due braccia contemporaneamente.

La tecnologia sarà inizialmente accessibile a gruppi selezionati tramite un programma di accesso anticipato, prima che Microsoft renda la disponibile su larga scala sulla sua piattaforma Foundry. Le aziende potranno quindi adattare il sistema alle proprie esigenze specifiche utilizzando i propri dati.

Aggiungere il tocco all'intelligenza dei robot

Fabbriche e magazzini sono alla ricerca di robot in grado di gestire condizioni variabili anziché ripetere all'infinito gli stessi movimenti programmati. Gli ambienti ospedalieri necessitano di macchine chesi adattinoa situazioni diverse. Le linee di produzione, dove gli articoli variano da lotto a lotto, creano problemi che l'automazione tradizionale non riesce a risolvere in modo efficiente. Microsoft ha creato Rho-alpha per rispondere a questa esigenza, elaborando ciò che i robot vedono e sentono, oltre a ciò che percepiscono fisicamente tramite i sensori.

la maggior parte dei sistemi robotici Oggi si affida a telecamere e microfoni per comprendere l'ambiente circostante ed eseguire le istruzioni. Rho-alpha aggiunge un ulteriore livello di intelligenza, considerando il tatto altrettanto importante. Quando una pinza robotica integra sensori di pressione, il sistema ottiene informazioni che le telecamere non riescono a rilevare. Questo è fondamentale quando si cerca di inserire un componente in una presa o di assemblare parti in situazioni in cui la sola vista non fornisce dettagli sufficienti per verificare il corretto allineamento.

Microsoft ha mostrato queste capacità utilizzando due bracci robotici Universal Robots UR5e dotati di sensori in grado di rilevare pressione e contatto. Durante i test con una serie di attività chiamata BusyBox, gli utenti hanno chiesto al robot di eseguire azioni come inserire un vassoio in una cassetta degli attrezzi e chiuderne il coperchio. Il sistema ha trasformato queste istruzioni in movimenti coordinati tra i due bracci e ha apportato delle correzioni in base alle informazioni rilevate dai sensori. Quando i tentativi di inserire una spina non andavano a buon fine al primo colpo, un operatore umano poteva guidare il robot utilizzando un dispositivo di input 3D e il sistema apprendeva da queste correzioni.

Ottenere dati di addestramento sufficienti rimane la sfida più grande nella costruzione di robot efficienti. I modelli linguistici possono apprendere da enormi quantità di testo disponibili online, ma l'addestramento dei robot richiede dimostrazioni fisiche reali, la cui registrazione richiede tempo e denaro. Microsoft ha affrontato questo problema addestrando Rho-alpha su tre tipi di informazioni: registrazioni di dimostrazioni fisiche reali, simulazioni di attività pratiche e ampi set di dati di immagini con domande e risposte dal web. L'azienda utilizza Nvidia Isaac Sim in esecuzione su server Azure per creare scenari sintetici realistici attraverso un processo di apprendimento per rinforzo.

Questa configurazione di simulazione produce situazioni pratiche fisicamente accurate che integrano le dimostrazioni reali. L'approccio combinato consente al modellodi affrontarecasi insoliti e situazioni di guasto che altrimenti richiederebbero migliaia di ore di funzionamento nel mondo reale per essere catturate.

Il metodo di addestramentosegueuno schemadaaltre aziendenel settore dellarobotica utilizzato Il sistema Gemini Robotics di Google DeepMind, il modello Helix di Figure AI per robot umanoidi e Pi-zero di Physical Intelligence adottano tutti approcci simili per ovviare al problema della scarsità di dati. Questa tecnica aiuta questi sistemiad apprendereabilità di manipolazione generali senza la necessità di dimostrazioni specifiche per ogni singolo compito che potrebbero dover affrontare.

Competere in un mercato in via di maturazione

Microsoft entra a far parte di unmercato di modelli di base per la robotica che è cresciuto considerevolmente nell'ultimo anno e mezzo. Nvidia ha rilasciato GR00T N1.6 , pensato per i robot umanoidi, focalizzandosi sul controllo dell'intero corpo e sulla comprensione del contesto. Google DeepMind ha ampliato Gemini alla robotica con capacità che spaziano dal piegare la carta in forme origami alla gestione delle carte da gioco. Physical Intelligence presenta Pi-zero come un sistema multiuso, addestrato per diverse tipologie di robot.

Rho-alpha si distingue per treaspetti. In primo luogo, l'enfasi sulla percezione tattile affronta situazioni in cui i sistemi che si basano esclusivamente sulla vista incontrano difficoltà. In secondo luogo, il modello deriva dalla serie Phi di Microsoft, che l'azienda ha ottimizzato per funzionare in modo efficiente su hardware consumer standard. Questa provenienza suggerisce che potrebbe funzionare su dispositivi locali senza la necessità di una connessione costante ai server cloud. In terzo luogo, l'attenzione all'apprendimento dalle correzioni umane durante il funzionamento reale lo distingue dai modelli che necessitano di un addestramento completo per acquisire nuovi comportamenti.

Anche l'approccio commerciale di Microsoft si differenzia daquello deiconcorrenti. L'azienda prevede di offrire Rho-alpha tramite la sua piattaforma Foundry come infrastruttura che produttori e integratori di sistemi potranno personalizzare con le proprie informazioni proprietarie. Questo rispecchia l'approccio adottato dall'azienda con Azure OpenAI Service e si rivolge alle organizzazioni che desiderano creare versioni specializzate anziché utilizzare un modello generico.

Per le aziende manifatturiere e logistiche, l' opportunità risiede nell'individuare le attività di movimentazione ripetitive in cui l'automazione attuale risulta insufficiente. Stazioni di controllo qualità, operazioni di assemblaggio di kit di articoli e linee di assemblaggio di piccoli lotti rappresentano situazioni in cui la combinazione di comprensione del linguaggio e rilevamento tattile di Rho-alpha potrebbe ridurre i requisiti di programmazione.

Il programma di accesso anticipato annunciato da Microsoft offre organizzazioniun modo per testare se il sistema soddisfa le loro esigenze prima di investire nell'infrastruttura di distribuzione. Le aziende dovrebbero affrontare queste valutazioni prevedendo che sarà necessaria la supervisione umana e pianificare flussi di lavoro in cui gli operatori correggono e guidano i robot durante i periodi di apprendimento iniziale.

fisica L'intelligenza artificiale rappresenta un passaggio dai robot come strumenti programmati ai robot come collaboratori flessibili. Questo passaggio richiederà anni anziché mesi, ma i modelli di base forniti da Microsoft, Nvidia e Google stabiliscono i modelli di base che definiranno defirobotica aziendale per i prossimi dieci anni.

Esiste una via di mezzo tra lasciare i soldi in banca e tentare la fortuna con le criptovalute. Inizia con questo video gratuito sulla finanza decentralizzata.

Condividi questo articolo
ALTRE NOTIZIE
INTENSIVO CRIPTOVALUTE
CORSO