🔥 Trade with Pros on Discord → 21 Days Free (No Card)JOIN FREE

Abordagem inovadora usa feedback colaborativo para acelerar o aprendizado de robôs

Nesta postagem:

  • HuGE, ou Exploração Guiada por Humanos, revoluciona o treinamento de IA ao aproveitar o feedback colaborativo para acelerar o aprendizado.
  • Essa abordagem inovadora permite que agentes de IA aprendam mais rapidamente, mesmo com dados ruidosos provenientes de usuários não especialistas.
  • O HuGE tem o potencial de ampliar o treinamento de IA e capacitar robôs a aprender tarefas complexas de formadent.

Uma abordagem inovadora para o ensino de agentes de inteligência artificial (IA), conhecida como Exploração Guiada por Humanos (HuGE, na sigla em inglês), emergiu como um método transformador na pesquisa em IA. Desenvolvida em colaboração por pesquisadores do MIT, da Universidade de Harvard e da Universidade de Washington, a HuGE permite que agentes de IA aprendam novas tarefas de forma mais rápida e eficaz com a ajuda de feedback humano não especializado. Essa técnica inovadora está prestes a revolucionar a forma como os agentes de IA adquirem novas habilidades, possibilitando que robôs aprendam tarefas complexas de formadentcom a orientação de feedback colaborativo.

Desafios no treinamento de IA

O treinamento de agentes de IA para executar novas tarefas geralmente envolve um processo chamado aprendizado por reforço, no qual o agente aprende por meio de tentativa e erro, recebendo recompensas por ações que o aproximam de um objetivodefi. Em muitos casos, especialistas humanos precisam projetar meticulosamente uma função de recompensa, um mecanismo de incentivo que motiva o agente de IA a explorar e agir. No entanto, projetar essas funções de recompensa pode ser demorado, ineficiente e difícil de escalar, principalmente para tarefas complexas que envolvem várias etapas.

Feedback colaborativo como solução

A abordagem HuGE introduz uma mudança revolucionária ao aproveitar o feedback colaborativo coletado de usuários não especialistas para orientar os processos de aprendizagem de agentes de IA. Ao contrário dos métodos tradicionais que dependem de funções de recompensa projetadas por especialistas, o HuGE permite que os agentes de IA aprendam mais rapidamente, mesmo quando trabalham com dados ruidosos de não especialistas, cujo feedback pode conter erros que poderiam prejudicar outros métodos.

Desacoplando o processo de aprendizagem

Os pesquisadores por trás do HuGE dividiram o processo de aprendizado em dois componentes distintos, cada um conduzido por seu próprio algoritmo. Essa abordagem separa a seleção de objetivos da fase de exploração, permitindo que o agente aprenda de forma eficiente com feedback coletivo. Os dois componentes principais do HuGE são os seguintes:

Veja também:  Reino Unido registra primeira queda anual no número de detentores de criptomoedas, de 12% em 2024.

1. Algoritmo de seleção de objetivos : Esta parte da abordagem é atualizada continuamente com base no feedback de usuários não especialistas. Em vez de usar o feedback como uma função de recompensa direta, ele guia a exploração do agente. Os usuários fornecem informações selecionando qual estado está mais próximo do objetivo desejado, permitindo que o agente ajuste sua exploração de acordo.

2. Exploração do agente: O agente de IA explora seu ambiente de forma independente dent guiado pelo feedback do seletor de objetivos. Ele coleta dados, como imagens ou vídeos de suas ações, que são então enviados a usuários humanos para obter feedback adicional. Esse ciclo restringe as áreas de exploração do agente, direcionando-o para caminhos promissores para atingir seu objetivo.

Benefícios do HuGE

O HuGE oferece diversas vantagens em relação aos métodos tradicionais de treinamento de agentes de IA:

  • Aprendizagem mais rápida: Essa abordagem permite que agentes de IA aprendam novas tarefas mais rapidamente, mesmo quando o feedback humano contém erros ou imprecisões.
  • Feedback assíncrono: O HuGE permite que o feedback seja coletado de forma assíncrona de usuários não especialistas em todo o mundo, tornando-se uma solução escalável e versátil.
  • Aprendizagem autônoma: Os agentes podem continuar aprendendo de forma autônoma, mesmo quando o feedback é limitado ou atrasado, garantindo o progresso contínuo.

Testes em situações reais e simuladas

Os pesquisadores realizaram extensos testes em tarefas simuladas e do mundo real para validar a eficácia do HuGE. Nas simulações, eles treinaram com sucesso agentes de IA para executar tarefas complexas com longas sequências de ações, como empilhar blocos em ordens específicas ou navegar por labirintos intrincados. Os experimentos no mundo real envolveram o treinamento de braços robóticos para desenhar formas e pegar objetos, com dados obtidos por meio de crowdsourcing de usuários não especialistas em 13 países e três continentes.

Veja também:  CEO da Nansen, Svanevik, alerta a ETH: Fiquem mais paranoicos ou se tornarão irrelevantes até 2030.

Ampliação de escala e aplicações futuras

Os resultados promissores do HuGE e a facilidade de obter feedback de não especialistas sugerem que ele possui grande potencial para ampliar o treinamento de IA. No futuro, esse método poderá permitir que robôs aprendam e executem tarefas específicas nas casas dos usuários sem a necessidade de demonstrações presenciais. Ao se basearem no feedback colaborativo, os robôs podem explorar o ambiente de forma autônoma, guiados pela contribuição coletiva de não especialistas.

Os pesquisadores enfatizam a importância de garantir que os agentes de IA estejam alinhados com os valores humanos e as considerações éticas. À medida que os agentes de IA aprendem e tomam decisões de formadent, as diretrizes éticas e o alinhamento de valores são cruciais para sua implantação segura e responsável.

Direções futuras

A equipe pretende aprimorar ainda mais a abordagem HuGE. Eles planejam permitir que agentes de IA aprendam com diversas formas de comunicação, como linguagem natural e interações físicas com robôs. Além disso, estão explorando a possibilidade de usar o HuGE para treinar múltiplos agentes simultaneamente, abrindo novos caminhos para o aprendizado colaborativo de IA.

A Exploração Guiada por Humanos (HuGE) representa um avanço significativo no treinamento de IA, simplificando o processo de ensinar novas tarefas a agentes de IA. Ao aproveitar a sabedoria coletiva de usuários não especialistas, a HuGE acelera o aprendizado, reduz a necessidade de funções de recompensa projetadas por especialistas e abre caminho para que robôs adquiram habilidades complexas de forma autônoma. À medida que o campo da IA ​​continua a evoluir, a HuGE se destaca como uma prova do potencial do aprendizado colaborativo e guiado pela multidão na formação do futuro dos agentes inteligentes.

Cadastre-se no Bybit e comece a negociar com US$ 30.050 em presentes de boas-vindas

Compartilhar link:

Isenção de responsabilidade. As informações fornecidas não constituem aconselhamento comercial. A Cryptopolitan.com não se responsabiliza por quaisquer investimentos feitos com base nas informações fornecidas nesta página. Recomendamos tron dent independentes e/ou a consulta de um profissional qualificado antes de tomar qualquer decisão de investimento.

Mais lidos

Carregando os artigos mais lidos...

Fique por dentro das notícias sobre criptomoedas, receba atualizações diárias na sua caixa de entrada

Escolha do editor

Carregando artigos da Escolha do Editor...

- O boletim informativo sobre criptomoedas que mantém você à frente -

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Assine o Cryptopolitan Daily e receba insights oportunos, precisos e relevantes sobre criptomoedas diretamente na sua caixa de entrada.

Cadastre-se agora e
não perca nenhuma jogada.

Entre. Obtenha os fatos.
Saia na frente.

Assine o CryptoPolitan