Pesquisadores da Microsoft revelam técnica inovadora para apagar conhecimento específico de grandes modelos de linguagem

By Brenda Kanana
Atualizado em: 7 de outubro de 2023, 6h29 UTC

Tempo de leitura: 3 minutos

Adicione-nos como sua fonte preferida no Google

379619

Conteúdo

1. Um salto significativo em adaptabilidade

2. Apagamento eficiente em uma hora de GPU

3. Desconstruindo a técnica de três partes

4. Avaliando o sucesso

5. Implicações e pesquisas futuras

Compartilhar link:

Neste post:

Pesquisadores da Microsoft revelam uma nova maneira de fazer com que modelos de IA esqueçam informações específicas, como Harry Potter, sem a necessidade de um treinamento extenso.
Sua técnica de três etapas apaga o conhecimento de forma eficiente em apenas uma hora de GPU, mantendo intacto o desempenho geral da IA.
Essa descoberta oferece esperança para modelos de IA mais adaptáveis e éticos no futuro.

Em um avanço notável na área da inteligência artificial, uma equipe de pesquisadores da Microsoft revelou uma abordagem pioneira para modificar seletivamente conhecimento específico em grandes modelos de linguagem (LLMs). Essa metodologia inovadora, detalhada em um artigo recente na renomada plataforma arXiv.org, aborda uma questão pertinente relacionada ao uso de materiais protegidos por direitos autorais durante o treinamento de LLMs. Além disso, oferece uma solução promissora para a questão de se esses modelos podem se adaptar sem a necessidade de extenso retreinamento.

Um salto significativo em adaptabilidade

Grandes modelos de linguagem, incluindo o ChatGPT da OpenAI, o Llama 2 da Meta e o Claude 2 da Anthropic, têmtracconsiderável atenção e escrutínio devido à sua excepcional capacidade de gerar conteúdo textual com base nos extensos conjuntos de dados com os quais são treinados, os quais podem incluir materiais protegidos por direitos autorais. O desafio de personalizar esses modelos para que esqueçam ou desaprendam informações específicas tem sido uma preocupação constante.

Apagamento eficiente em uma hora de GPU

Os pesquisadores da Microsoft , Ronen Eldan e Mark Russinovich, propuseram uma solução elegante para esse desafio. Seu artigo apresenta uma técnica tripla projetada para simular o processo de desaprendizado de informações específicas em Modelos de Linguagem de Aprendizagem (LLMs). O aspecto mais notável de sua abordagem é a eficiência. Eles demonstram a capacidade de apagar todo o conhecimento referente aos livros de Harry Potter, incluindo personagens e detalhes da trama, com apenas uma hora de GPU dedicada ao ajuste fino. Esse alto nível de eficiência é bastante promissor para o desenvolvimento de modelos de linguagem mais adaptáveis e responsivos.

Veja também: dent da SpaceX enfrenta maior desafio enquanto empresa mira IPO recorde

Desconstruindo a técnica de três partes

A técnica de Eldan e Russinovich representa um afastamento notável da abordagem tradicional de aprendizado de máquina, que se concentra principalmente na acumulação de conhecimento sem fornecer mecanismos diretos para o desaprendizado. Sua abordagem inovadora compreende três etapas fundamentais:

1.dentde tokens relevantes: Na fase inicial, o modelo é treinado usando os dados alvo — neste caso, os livros de Harry Potter. O modelodentos tokens mais intimamente associados aos dados alvo, comparando suas previsões com as geradas por um modelo de referência. Esta etapa inicial é a base para identificar o conhecimento a ser apagado.

2. Substituição de expressões únicas: O segundo passo envolve a substituição de expressões únicas específicas da série Harry Potter por expressões genéricas. Ao fazer isso, os pesquisadores geram previsões alternativas que espelham efetivamente a saída de um modelo sem os dados de treinamento específicos. Essa substituição é um elemento crucial no processo de eliminação do conhecimento prévio.

3. Ajuste fino e apagamento: A etapa final consiste em ajustar o modelo base utilizando as previsões alternativas. Esse processo de ajuste fino apaga o texto original da memória do modelo quando este recebe um contexto relacionado à série Harry Potter. Essa etapa crucial permite que o modelo "esqueça" as narrativas complexas dos livros de Harry Potter.

Avaliando o sucesso

Eldan e Russinovich realizaram uma série abrangente de testes para avaliar a eficácia de sua metodologia. Eles examinaram a proficiência do modelo em gerar ou discutir conteúdo relacionado à série Harry Potter usando 300 prompts geradosmatice analisaram meticulosamente as probabilidades dos tokens. De suma importância, suas descobertas indicam que, após apenas uma hora de ajustes finos, o modelo era capaz de essencialmente "esquecer" as narrativas detalhadas da série Harry Potter. Notavelmente, esse apagamento teve repercussões mínimas no desempenho do modelo em avaliações de referência padrão, como ARC, BoolQ e Winogrande.

Veja também: Fundador da Citadel afirma que GenAI não consegue aumentar os retornos dos fundos de hedge

Implicações e pesquisas futuras

Embora essa técnica inovadora demonstre grande potencial, é imprescindível ressaltar que pesquisas adicionais são indispensáveis para refinar e expandir a metodologia, principalmente no que diz respeito a tarefas de desaprendizagem mais abrangentes em grandes modelos de linguagem. Vale destacar que essa abordagem pode ser particularmente eficaz para textos de ficção, como a série Harry Potter, devido à presença de referências únicas.

À medida que os sistemas de inteligência artificial desempenham um papel cada vez mais crucial em diversos domínios, a capacidade de esquecer ou desaprender seletivamente informações específicas assume importância fundamental. Esta metodologia representa um passo essencial para o desenvolvimento de sistemas de aprendizagem baseados em leis (LLMs) mais responsáveis, adaptáveis e em conformidade com a legislação. Ela possui o potencial de atender a diretrizes éticas, valores sociais e às necessidades específicas dos usuários, conforme o campo da IA continua a evoluir.

Se você está lendo isto, já está um passo à frente. Continue assim assinando nossa newsletter .

Compartilhar link:

Leia o aviso legal

Aviso Legal. As informações fornecidas não constituem aconselhamento de investimento. O Cryptopolitan não se responsabiliza por quaisquer investimentos realizados com base nas informações fornecidas nesta página. Recomendamos tron a realização de pesquisas independentes dent /ou a consulta a um profissional qualificado antes de tomar qualquer decisão de investimento.

Escolha do editor

Carregando artigos selecionados pela equipe editorial...

Pesquisadores da Microsoft revelam técnica inovadora para apagar conhecimento específico de grandes modelos de linguagem

Conteúdo

Neste post:

Um salto significativo em adaptabilidade

Apagamento eficiente em uma hora de GPU

Desconstruindo a técnica de três partes

Avaliando o sucesso

Implicações e pesquisas futuras

Compartilhar link:

Mais lidas

Fique por dentro das notícias sobre criptomoedas e receba atualizações diárias na sua caixa de entrada

Escolha do editor

Cadastre-se e fique por dentro do topo

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Entre. Informe-se.
Saia na frente.

Pesquisadores da Microsoft revelam técnica inovadora para apagar conhecimento específico de grandes modelos de linguagem

Conteúdo

Neste post:

Um salto significativo em adaptabilidade

Apagamento eficiente em uma hora de GPU

Desconstruindo a técnica de três partes

Avaliando o sucesso

Implicações e pesquisas futuras

Compartilhar link:

Mais lidas

Fique por dentro das notícias sobre criptomoedas e receba atualizações diárias na sua caixa de entrada

Escolha do editor

Cadastre-se e fique por dentro do topo

Siga-nos

- A newsletter de criptomoedas que te mantém sempre um passo à frente -

Os mercados se movem rapidamente.

Nós nos movemos mais rápido.

Entre. Informe-se. Saia na frente.

Entre. Informe-se.
Saia na frente.