Your bank is using your money. You’re getting the scraps.WATCH FREE

Inovação da Microsoft supera limitações de robôs com sistema de detecção por toque

Neste post:

  • A Microsoft lançou o Rho-alpha no final de janeiro de 2026, um modelo de robô que utiliza sensores de visão, linguagem e tato para tarefas que exigem o uso dos dois braços.
  • O sistema ajusta a aderência com base em feedback físico que as câmeras não conseguem detectar, sendo útil para inserir plugues e encaixar peças.
  • Disponível através do Microsoft Foundry para que os fabricantes possam personalizar para tarefas de manuseio repetitivo.

A Microsoft Research lançou, no final de janeiro de 2026, um novo sistema de controle de robôs que permite que as máquinas trabalhem com as mãos enquanto processam comandos de voz e feedback físico. O sistema, chamado Rho-alpha, marca a entrada da empresa em modelos básicos projetados para robôs que usam dois braços simultaneamente.

A tecnologia chegará a grupos selecionados por meio de um Programa de Acesso Antecipado, antes de a Microsoft disponibilizá -la forma mais ampla em sua plataforma Foundry. As empresas poderão então adaptar o sistema às suas necessidades específicas, utilizando seus próprios dados.

Adicionando tato à inteligência robótica

Fábricas e armazéns buscam robôs capazes de lidar com condições variáveis, em vez de repetir indefinidamente os mesmos movimentos programados. Ambientes hospitalares necessitam de máquinas que se adaptem a diferentes situações. Linhas de produção onde os itens variam de lote para lote criam problemas que a automação tradicional não consegue resolver com eficiência. A Microsoft desenvolveu o Rho-alpha para atender a essa necessidade, processando o que os robôs veem e ouvem, além do que eles sentem fisicamente por meio de sensores.

A maioria dos sistemas robóticos atuais depende de câmeras e microfones para entender o ambiente ao seu redor e receber instruções. O Rho-alpha adiciona uma camada extra, tratando o tato como igualmente importante. Quando uma garra robótica possui sensores de pressão integrados, o sistema obtém informações que as câmeras não conseguem captar. Isso é crucial ao tentar conectar algo a uma tomada ou encaixar peças, situações em que a visão sozinha não fornece detalhes suficientes para determinar se tudo está alinhado corretamente.

A Microsoft demonstrou essas capacidades usando dois braços robóticos UR5e da Universal Robots equipados com sensores que detectam pressão e contato. Durante testes com um conjunto de tarefas chamado BusyBox, os usuários instruíam o robô a realizar ações como colocar uma bandeja dentro de uma caixa de ferramentas e fechar a tampa. O sistema transformava esses comandos em movimentos coordenados entre os dois braços e fazia ajustes com base nas informações captadas pelos sensores. Quando as tentativas de inserir um plugue falhavam na primeira tentativa, um operador humano podia guiar o robô usando um dispositivo de entrada 3D, e o sistema aprendia com essas correções.

Veja também:  Livros sem sentido gerados por IA sobem na lista de mais vendidos da Amazon, gerando preocupações.

Obter dados de treinamento suficientes continua sendo o maior desafio na construção de robôs capazes. Modelos de linguagem podem aprender com grandes quantidades de texto disponíveis online, mas o treinamento de robôs requer demonstrações físicas reais, que demandam tempo e dinheiro para serem gravadas. A Microsoft resolveu esse problema treinando o Rho-alpha com três tipos de informação: gravações de demonstrações físicas reais, tarefas práticas simuladas e grandes conjuntos de dados de imagens com perguntas e respostas da internet. A empresa utiliza o Nvidia Isaac Sim, executado em servidores Azure, para criar cenários sintéticos realistas por meio de um processo de aprendizado por reforço.

Essa configuração de simulação produz situações práticas fisicamente precisas que complementam as demonstrações reais. A abordagem combinada permite que o modelo simule casos incomuns e situações de falha que, de outra forma, exigiriam milhares de horas de operação no mundo real para serem capturadas.

O método de treinamento segue padrões utilizados por outras empresas de robótica O sistema Gemini Robotics do Google DeepMind, o modelo Helix da Figure AI para robôs humanoides e o Pi-Zero da Physical Intelligence adotam abordagens semelhantes para contornar o problema da escassez de dados. A técnica ajuda esses sistemas a aprender habilidades gerais de manipulação sem a necessidade de demonstrações específicas para cada tarefa que possam enfrentar.

Competir num mercado em processo de maturação

A Microsoft entra para robótica , que cresceu consideravelmente no último ano e meio. A Nvidia lançou o GR00T N1.6 , voltado para robôs humanoides, com foco no controle de todo o corpo e na compreensão do contexto. O Google DeepMind expandiu o Gemini para a robótica, com habilidades que vão desde dobrar papel em origami até manipular cartas de baralho. A Physical Intelligence apresenta o Pi-zero como um sistema multifuncional treinado para diferentes tipos de robôs.

Veja também:  Engenheiro da Microsoft expressa preocupação com a criação de imagens violentas e sexuais por ferramenta de IA.

O Rho-alpha se destaca de três maneiras . Primeiro, a ênfase na percepção tátil resolve situações em que sistemas que dependem apenas da visão encontram dificuldades. Segundo, o modelo deriva da série Phi da Microsoft, que a empresa otimizou para funcionar de forma eficiente em hardware de consumo comum. Essa experiência sugere que ele pode ser executado em dispositivos locais sem a necessidade de conexão constante com servidores na nuvem. Terceiro, o foco no aprendizado a partir de correções humanas durante a operação real o diferencia de modelos que precisam de um re-treinamento completo para adquirir novos comportamentos.

A abordagem comercial da Microsoft também difere da concorrência . A empresa planeja oferecer o Rho-alpha por meio de sua plataforma Foundry como infraestrutura que fabricantes e integradores de sistemas podem personalizar com suas próprias informações proprietárias. Isso reflete a abordagem da empresa com o Azure OpenAI Service e visa organizações que desejam criar versões especializadas em vez de usar um modelo genérico.

Para fabricantes e empresas de logística, a oportunidade reside na identificação de tarefas repetitivas de manuseio onde a automação atual apresenta limitações. Estações de inspeção de qualidade, operações de montagem de kits de itens e linhas de produção de pequenos lotes representam situações em que a combinação de compreensão de linguagem e sensor de toque do Rho-alpha poderia reduzir os requisitos de programação.

O programa de acesso antecipado anunciado pela Microsoft oferece às organizações uma maneira de testar se o sistema atende às suas necessidades antes de investir na infraestrutura de implantação. As empresas devem participar dessas avaliações prevendo que a supervisão humana será necessária e devem planejar fluxos de trabalho nos quais os operadores corrijam e orientem os robôs durante os períodos iniciais de aprendizado.

A IA física representa uma mudança de paradigma, transformando robôs de ferramentas programadas em colaboradores flexíveis. Essa transição levará anos, e não meses, mas os modelos fundamentais da Microsoft, Nvidia e Google estabelecem os padrões básicos que definirão defi robótica empresarial pelos próximos dez anos.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter .

Compartilhar link:

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. O Cryptopolitan não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamos tron a realização de pesquisas independentes dent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Mais lidas

Carregando os artigos mais lidos...

Fique por dentro das notícias sobre criptomoedas e receba atualizações diárias na sua caixa de entrada

Escolha do editor

Carregando artigos selecionados pela equipe editorial...

- A newsletter de criptomoedas que te mantém sempre um passo à frente -

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Assine o Cryptopolitan Daily e receba informações oportunas, precisas e relevantes sobre criptomoedas diretamente na sua caixa de entrada.

Inscreva-se agora e
não perca nenhum lance.

Entre. Informe-se.
Saia na frente.

Inscreva-se no CryptoPolitan