Des chercheurs de Microsoft dévoilent une technique innovante pour effacer des connaissances spécifiques de grands modèles de langage

By Brenda Kanana
Mise à jour : 7 octobre 2023 à 6 h 29 UTC

3 minutes de lecture

Ajoutez-nous comme source privilégiée sur Google

379619

Contenu

1. Un bond significatif en matière d'adaptabilité

2. Effacement efficace en une heure GPU

3. Déconstruction de la technique en trois parties

4. Évaluer le succès

5. Implications et recherches futures

Partager le lien :

Dans cet article :

Des chercheurs de Microsoft dévoilent une nouvelle méthode permettant aux modèles d'IA d'oublier des informations spécifiques, comme Harry Potter, sans nécessiter de réentraînement massif.
Leur technique en trois étapes efface efficacement les connaissances en seulement une heure de calcul GPU tout en préservant les performances globales de l'IA.
Cette avancée majeure ouvre la voie à des modèles d'IA plus adaptables et éthiques à l'avenir.

Une avancée remarquable en intelligence artificielle a été réalisée par une équipe de chercheurs de Microsoft. Cette approche novatrice permet de modifier sélectivement certaines connaissances au sein de grands modèles de langage (LLM). Publiée récemment sur la plateforme arXiv.org, cette méthodologie révolutionnaire s'attaque à un problème crucial lié à l'utilisation de ressources protégées par le droit d'auteur lors de l'entraînement des LLM. Elle offre par ailleurs une solution prometteuse quant à la capacité de ces modèles à s'adapter sans nécessiter un réentraînement intensif.

Un bond significatif en matière d'adaptabilité

Les grands modèles de langage, tels que ChatGPT d'OpenAI, Llama 2 de Meta et Claude 2 d'Anthropic, onttracun intérêt et un examen considérables en raison de leur capacité exceptionnelle à générer du contenu textuel à partir des vastes ensembles de données sur lesquels ils sont entraînés, lesquels peuvent inclure des documents protégés par le droit d'auteur. La difficulté de personnaliser ces modèles pour qu'ils oublient ou désapprennent des informations spécifiques constitue depuis longtemps une préoccupation majeure.

Effacement efficace en une heure GPU

Les chercheurs de Microsoft , Ronen Eldan et Mark Russinovich, ont proposé une solution élégante à ce problème. Leur article présente une technique en trois étapes conçue pour simuler le processus de désapprentissage d'informations spécifiques au sein des modèles de langage. L'aspect le plus remarquable de leur approche est son efficacité. Ils démontrent notamment la capacité d'effacer toutes les connaissances relatives aux livres Harry Potter, y compris les personnages et les détails de l'intrigue, en seulement une heure de traitement GPU. Ce haut niveau d'efficacité est très prometteur pour le développement de modèles de langage plus adaptables et réactifs.

Voir aussi : dent de SpaceX face à son plus grand défi alors que l’entreprise vise une introduction en bourse record

Déconstruction de la technique en trois parties

La technique d'Eldan et Russinovich marque une rupture notable avec l'approche traditionnelle de l'apprentissage automatique, qui se concentre principalement sur l'accumulation de connaissances sans proposer de mécanismes simples pour désapprendre. Leur approche novatrice comprend trois étapes fondamentales :

1.dentdes jetons pertinents : Dans la phase initiale, le modèle est entraîné à l’aide des données cibles, ici les livres Harry Potter. Le modèledentles jetons les plus étroitement associés aux données cibles en comparant ses prédictions à celles générées par un modèle de référence. Cette étape initiale est essentielle pour déterminer précisément les connaissances à effacer.

2. Substitution des expressions uniques : La deuxième étape consiste à remplacer les expressions uniques propres à la série Harry Potter par des équivalents génériques. Ce faisant, les chercheurs génèrent des prédictions alternatives qui reproduisent fidèlement les résultats d’un modèle dépourvu des données d’entraînement spécifiques. Cette substitution est un élément crucial du processus d’effacement des connaissances.

3. Mise au point et effacement : La dernière étape consiste à affiner le modèle de base à l’aide des prédictions alternatives. Ce processus d’affinage efface le texte original de la mémoire du modèle lorsqu’il est confronté au contexte de la série Harry Potter. Cette étape cruciale permet au modèle d’« oublier » les récits complexes des livres Harry Potter.

Évaluer le succès

Eldan et Russinovich ont mené une série de tests exhaustifs pour évaluer l'efficacité de leur méthodologie. Ils ont examiné la capacité du modèle à générer ou à analyser du contenu relatif à la saga Harry Potter à l'aide de 300 amorces généréesmaticet en analysant minutieusement les probabilités d'apparition des éléments. Point crucial, leurs résultats indiquent qu'après seulement une heure de réglage fin, le modèle pouvait en quelque sorte « oublier » les détails narratifs de la saga Harry Potter. Étonnamment, cet effacement n'a eu que des répercussions minimes sur les performances du modèle lors d'évaluations comparatives standard telles que ARC, BoolQ et Winogrande.

Voir aussi : Le fondateur de Citadel affirme que GenAI n’a pas réussi à améliorer les rendements des fonds spéculatifs

Implications et recherches futures

Bien que cette technique novatrice soit très prometteuse, il est impératif de souligner que des recherches supplémentaires sont indispensables pour affiner et étendre la méthodologie, notamment en ce qui concerne les tâches de désapprentissage plus vastes au sein de grands modèles linguistiques. Il convient de noter que cette approche pourrait s'avérer particulièrement efficace pour les textes de fiction, tels que la série Harry Potter, en raison de la présence de références uniques.

Alors que les systèmes d'intelligence artificielle jouent un rôle de plus en plus crucial dans divers domaines, la capacité d'oublier ou de désapprendre sélectivement certaines informations devient primordiale. Cette méthodologie constitue une étape fondamentale vers le développement de masters en apprentissage (LLM) plus responsables, adaptables et conformes à la législation. Elle offre la possibilité de répondre aux exigences éthiques, aux valeurs sociétales et aux besoins spécifiques des utilisateurs, à mesure que le domaine de l'IA évolue.

Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter .

Partager le lien :

Lire l'avertissement

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. Cryptopolitan.com Cryptopolitan toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous vous recommandons vivement d’effectuer vos tron dent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Articles les plus lus

Restez informé(e) de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte mail

Choix de la rédaction

Chargement des articles sélectionnés par la rédaction...

Des chercheurs de Microsoft dévoilent une technique innovante pour effacer des connaissances spécifiques de grands modèles de langage

Contenu

Dans cet article :

Un bond significatif en matière d'adaptabilité

Effacement efficace en une heure GPU

Déconstruction de la technique en trois parties

Évaluer le succès

Implications et recherches futures

Partager le lien :

Articles les plus lus

Restez informé(e) de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte mail

Choix de la rédaction

Inscrivez-vous et restez au sommet

Les marchés évoluent rapidement.

Nous avançons plus vite.

Entrez. Renseignez-vous.
Prenez de l'avance.

Des chercheurs de Microsoft dévoilent une technique innovante pour effacer des connaissances spécifiques de grands modèles de langage

Contenu

Dans cet article :

Un bond significatif en matière d'adaptabilité

Effacement efficace en une heure GPU

Déconstruction de la technique en trois parties

Évaluer le succès

Implications et recherches futures

Partager le lien :

Articles les plus lus

Restez informé(e) de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte mail

Choix de la rédaction

Inscrivez-vous et restez au sommet

Suivez-nous

- La newsletter crypto qui vous donne une longueur d'avance -

Les marchés évoluent rapidement.

Nous avançons plus vite.

Entrez. Renseignez-vous. Prenez de l'avance.

Entrez. Renseignez-vous.
Prenez de l'avance.