ÚLTIMAS NOTÍCIAS
SELECIONADO PARA VOCÊ
SEMANALMENTE
MANTENHA-SE NO TOPO

As melhores informações sobre criptomoedas direto na sua caixa de entrada.

Inovação da Microsoft supera limitações de robôs com sistema de detecção por toque

PorHania HumayunHania Humayun
Tempo de leitura: 4 minutos
Inovação da Microsoft supera limitações de robôs com sistema de detecção por toque.
  • A Microsoft lançou o Rho-alpha no final de janeiro de 2026, um modelo de robô que utiliza sensores de visão, linguagem e tato para tarefas que exigem o uso dos dois braços.
  • O sistema ajusta a aderência com base em feedback físico que as câmeras não conseguem detectar, sendo útil para inserir plugues e encaixar peças.
  • Disponível através do Microsoft Foundry para que os fabricantes possam personalizar para tarefas de manuseio repetitivo.

A Microsoft Researchlançou,no final de janeiro de 2026, um novo sistema de controle de robôs que permite que as máquinastrabalhemcom as mãos enquanto processam comandos de voz e feedback físico. O sistema, chamado Rho-alpha, marca a entrada da empresa em modelos básicos projetados para robôs que usam dois braços simultaneamente.

A tecnologia chegará a grupos selecionados por meio de um Programa de Acesso Antecipado, antes de a Microsoft disponibilizá -la forma mais ampla em sua plataforma Foundry. As empresas poderão então adaptar o sistema às suas necessidades específicas, utilizando seus próprios dados.

Adicionando tato à inteligência robótica

Fábricas e armazéns buscam robôs capazes de lidar com condições variáveis, em vez de repetir indefinidamente os mesmos movimentos programados. Ambientes hospitalares necessitam de máquinas que seadaptema diferentes situações. Linhas de produção onde os itens variam de lote para lote criam problemas que a automação tradicional não consegue resolver com eficiência. A Microsoft desenvolveu o Rho-alpha para atender a essa necessidade, processando o que os robôs veem e ouvem, além do que eles sentem fisicamente por meio de sensores.

A maioria dos sistemas robóticos atuais depende de câmeras e microfones para entender o ambiente ao seu redor e receber instruções. O Rho-alpha adiciona uma camada extra, tratando o tato como igualmente importante. Quando uma garra robótica possui sensores de pressão integrados, o sistema obtém informações que as câmeras não conseguem captar. Isso é crucial ao tentar conectar algo a uma tomada ou encaixar peças, situações em que a visão sozinha não fornece detalhes suficientes para determinar se tudo está alinhado corretamente.

A Microsoft demonstrou essas capacidades usando dois braços robóticos UR5e da Universal Robots equipados com sensores que detectam pressão e contato. Durante testes com um conjunto de tarefas chamado BusyBox, os usuários instruíam o robô a realizar ações como colocar uma bandeja dentro de uma caixa de ferramentas e fechar a tampa. O sistema transformava esses comandos em movimentos coordenados entre os dois braços e fazia ajustes com base nas informações captadas pelos sensores. Quando as tentativas de inserir um plugue falhavam na primeira tentativa, um operador humano podia guiar o robô usando um dispositivo de entrada 3D, e o sistema aprendia com essas correções.

Obter dados de treinamento suficientes continua sendo o maior desafio na construção de robôs capazes. Modelos de linguagem podem aprender com grandes quantidades de texto disponíveis online, mas o treinamento de robôs requer demonstrações físicas reais, que demandam tempo e dinheiro para serem gravadas. A Microsoft resolveu esse problema treinando o Rho-alpha com três tipos de informação: gravações de demonstrações físicas reais, tarefas práticas simuladas e grandes conjuntos de dados de imagens com perguntas e respostas da internet. A empresa utiliza o Nvidia Isaac Sim, executado em servidores Azure, para criar cenários sintéticos realistas por meio de um processo de aprendizado por reforço.

Essa configuração de simulação produz situações práticas fisicamente precisas que complementam as demonstrações reais. A abordagem combinada permite que o modelosimulecasos incomuns e situações de falha que, de outra forma, exigiriam milhares de horas de operação no mundo real para serem capturadas.

O método de treinamentoseguepadrõesporoutras empresasderobótica utilizados O sistema Gemini Robotics do Google DeepMind, o modelo Helix da Figure AI para robôs humanoides e o Pi-Zero da Physical Intelligence adotam abordagens semelhantes para contornar o problema da escassez de dados. A técnica ajuda esses sistemasa aprenderhabilidades gerais de manipulação sem a necessidade de demonstrações específicas para cada tarefa que possam enfrentar.

Competir num mercado em processo de maturação

A Microsoft entra para robótica, que cresceu consideravelmente no último ano e meio. A Nvidia lançou o GR00T N1.6 , voltado para robôs humanoides, com foco no controle de todo o corpo e na compreensão do contexto. O Google DeepMind expandiu o Gemini para a robótica, com habilidades que vão desde dobrar papel em origami até manipular cartas de baralho. A Physical Intelligence apresenta o Pi-zero como um sistema multifuncional treinado para diferentes tipos de robôs.

O Rho-alpha se destaca de trêsmaneiras. Primeiro, a ênfase na percepção tátil resolve situações em que sistemas que dependem apenas da visão encontram dificuldades. Segundo, o modelo deriva da série Phi da Microsoft, que a empresa otimizou para funcionar de forma eficiente em hardware de consumo comum. Essa experiência sugere que ele pode ser executado em dispositivos locais sem a necessidade de conexão constante com servidores na nuvem. Terceiro, o foco no aprendizado a partir de correções humanas durante a operação real o diferencia de modelos que precisam de um re-treinamento completo para adquirir novos comportamentos.

A abordagem comercial da Microsoft também difere daconcorrência. A empresa planeja oferecer o Rho-alpha por meio de sua plataforma Foundry como infraestrutura que fabricantes e integradores de sistemas podem personalizar com suas próprias informações proprietárias. Isso reflete a abordagem da empresa com o Azure OpenAI Service e visa organizações que desejam criar versões especializadas em vez de usar um modelo genérico.

Para fabricantes e empresas de logística, a oportunidade reside na identificação de tarefas repetitivas de manuseio onde a automação atual apresenta limitações. Estações de inspeção de qualidade, operações de montagem de kits de itens e linhas de produção de pequenos lotes representam situações em que a combinação de compreensão de linguagem e sensor de toque do Rho-alpha poderia reduzir os requisitos de programação.

O programa de acesso antecipado anunciado pela Microsoft oferece às organizaçõesuma maneira de testar se o sistema atende às suas necessidades antes de investir na infraestrutura de implantação. As empresas devem participar dessas avaliações prevendo que a supervisão humana será necessária e devem planejar fluxos de trabalho nos quais os operadores corrijam e orientem os robôs durante os períodos iniciais de aprendizado.

física A IA representa uma mudança de paradigma, transformando robôs de ferramentas programadas em colaboradores flexíveis. Essa transição levará anos, e não meses, mas os modelos fundamentais da Microsoft, Nvidia e Google estabelecem os padrões básicos que definirão defirobótica empresarial pelos próximos dez anos.

As mentes mais brilhantes do mundo das criptomoedas já leem nossa newsletter. Quer participar? Junte-se a elas.

Compartilhe este artigo
MAIS… NOTÍCIAS
INTENSIVO AVANÇADAS
CURSO