Uma abordagem revolucionária de treinamento capacita a IA a generalizar como a mente humana

Por

Brian Koome

Tempo de leitura: 3 minutos - 26 de outubro de 2023

Um novo método de treinamento aprimora o raciocínio da IA, tornando-a mais semelhante ao humano.
O ensino de IA focado impulsiona a generalização.
Modelos pequenos, grandes avanços em IA.

Em um desenvolvimento inovador para o campo da inteligência artificial (IA), pesquisadores revelaram um novo protocolo de treinamento que pode aprimorar significativamente a capacidade de um modelo de IA de generalizar e compreender informações, aproximando-o da forma como os humanos aprendem e raciocinam. Essa abordagem inovadora desafia a crença convencional de que mais dados são a chave para aprimorar o aprendizado de máquina, oferecendo novas perspectivas sobre os segredos tanto da IA quanto da cognição humana.

Os seres humanos são excelentes em compreender e combinar vários componentes para dar sentido ao mundo, uma habilidade cognitiva conhecida como "composicionalidade" ou "generalizaçãomatic ". Ela nos permite decodificar frases desconhecidas, criar respostas originais e compreender os significados subjacentes das palavras e das regras gramaticais. Alcançar a composicionalidade tem sido um desafio para os desenvolvedores de IA, já que as redes neurais tradicionais têm dificuldade em emular esse aspecto fundamental da cognição humana.

Embora os modelos generativos de IA atuais, como o GPT-3 e o GPT-4 da OpenAI, consigam imitar a composicionalidade até certo ponto, eles frequentemente ficam aquém em certos parâmetros, falhando em compreender verdadeiramente o significado e a intenção por trás das frases que geram. No entanto, um estudo recente publicado na Nature sugere que um protocolo de treinamento exclusivo, focado em como as redes neurais aprendem, pode ser a chave para superar esse desafio.

Reformulando o processo de aprendizagem

Os autores do estudo adotaram uma abordagem diferente para o treinamento de IA, evitando a necessidade de criar arquiteturas de IA completamente novas. Em vez disso, começaram com um modelo Transformer padrão, a mesma arquitetura fundamental usada no ChatGPT e no Bard do Google, mas sem nenhum treinamento prévio com texto. A inovação crucial estava no próprio método de treinamento.

Os pesquisadores desenvolveram um conjunto de tarefas envolvendo uma linguagem fictícia composta por palavras sem sentido como “dax”, “lug”, “kiki”, “fep” e “blicket”. Essas palavras foram associadas a conjuntos de pontos coloridos, com algumas palavras representando diretamente cores específicas dos pontos e outras indicando funções que alteravam os resultados dos pontos. Por exemplo, “dax” representava um ponto vermelho, enquanto “fep” era uma função que, quando combinada com “dax” ou outras palavras simbólicas, multiplicava o resultado do ponto correspondente por três. Crucialmente, a IA não recebeu nenhuma informação sobre essas associações; os pesquisadores simplesmente forneceram exemplos de frases sem sentido juntamente com as configurações de pontos correspondentes.

Inteligência Artificial: Alcançando uma compreensão semelhante à humana

À medida que o modelo de IA era treinado, ele gradualmente aprendia a responder de forma coerente, aderindo às regras implícitas da linguagem sem sentido. Mesmo quando confrontada com novas combinações de palavras, a IA demonstrou sua capacidade de "compreender" as regras inventadas da linguagem e aplicá-las a frases nunca antes vistas. Essa façanha notável indicou o potencial da IA para generalizar, um passo crucial rumo ao raciocínio semelhante ao humano.

Para avaliar o desempenho da IA, os pesquisadores a compararam com participantes humanos. Em alguns casos, a IA treinada respondeu com 100% de precisão, superando os humanos, que alcançaram uma taxa de acerto de aproximadamente 81%. Mesmo quando a IA cometeu erros, estes foram semelhantes a erros comuns cometidos por humanos, evidenciando sua capacidade de raciocínio similar ao humano.

O que é particularmente notável é que esse desempenho impressionante foi alcançado com um modelo Transformer relativamente pequeno, e não com uma IA massiva treinada em vastos conjuntos de dados. Essa descoberta sugere que, em vez de inundar os modelos de aprendizado de máquina com dados infinitos, uma abordagem mais focada, semelhante a uma aula especializada de linguística ou álgebra, pode gerar melhorias substanciais nas capacidades da IA.

Implicações e direções futuras

Embora este novo protocolo de treinamento ofereça resultados promissores, é essencial reconhecer suas limitações. O modelo de IA se destacou em tarefas específicas relacionadas ao reconhecimento de padrões em uma linguagem inventada, mas apresentou dificuldades ao se deparar com desafios totalmente novos ou formas de generalização não praticadas. Consequentemente, é crucial reconhecer que alcançar uma generalização limitada em IA é um passo significativo, mas fica aquém do objetivo final da inteligência artificial geral.

Armando Solar-Lezama, cientista da computação do Instituto de Tecnologia de Massachusetts (MIT), observa que esta pesquisa pode abrir novos caminhos para o aprimoramento da IA. Ao focar no ensino de modelos para raciocinar de forma eficaz, mesmo em tarefas sintéticas, podemos encontrar maneiras de ampliar as capacidades da IA além dos limites atuais. No entanto, a ampliação desse novo protocolo de treinamento pode apresentar desafios que precisam ser enfrentados.

Além das implicações práticas para a IA, esta pesquisa também pode lançar luz sobre o funcionamento interno das redes neurais e suas capacidades emergentes. A compreensão desses processos pode contribuir para minimizar erros em sistemas de IA e aprimorar nossa compreensão da cognição humana.

Não se limite a ler notícias sobre criptomoedas. Compreenda-as. Assine nossa newsletter. É grátis.

Compartilhe este artigo

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. CryptopolitanO não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamostrona realização de pesquisas independentesdent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Brian Koome

Brian Koome tem mais de sete anos de experiência em reportagens sobre blockchain e criptomoedas, atuando no setor desde 2017. Ele contribuiu para publicações de destaque, incluindo o BlockToday.com. Além disso, desenvolveu o curso Ethereum 101 para o BitDegree.org antes de se juntar ao Cryptopolitan como redator em tempo integral. Brian escreve guias permanentes (EGs), análises aprofundadas, entrevistas e análises de preços. Seu foco em DeFi, inovação em blockchain e projetos cripto emergentes encanta os leitores.

ÍNDICE

1. Reformulando o processo de aprendizagem

2. Inteligência Artificial: Alcançando uma compreensão semelhante à humana

3. Implicações e direções futuras

Compartilhe este artigo