DERNIÈRES NOUVELLES
SÉLECTIONNÉ POUR VOUS
HEBDOMADAIRE
RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Les modèles d'IA maîtrisent des capacités bien avant de les manifester, selon une étude

ParOwotunse AdebayoOwotunse Adebayo
3 minutes de lecture
Les modèles d'IA maîtrisent des capacités bien avant de les manifester, selon une étude
  • Des recherches ont montré que les modèles d'IA maîtrisent des capacités bien avant de les manifester.
  • Les chercheurs affirment que ces modèles peuvent intérioriser des concepts bien avant de les manifester.
  • Des chercheurs dévoilent différentes méthodes pour révéler des capacités cachées.

De nouvelles recherches ont démontré que les modèles d'intelligence artificielle (IA) possèdent certaines capacités bien avant de les manifester lors de leur apprentissage. Selon cette étude menée par Harvard et l'Université du Michigan, les modèles ne révèlent ces aptitudes que lorsqu'ils en ont besoin, d'une manière ou d'une autre.

Cette recherche fait partie des nombreuses études menées pour comprendre comment les modèles d'IA développent leurs capacités avant de les présenter.

L' étude a analysé comment les modèles d'IA apprennent des concepts de base comme la taille et la couleur, révélant qu'ils maîtrisent ces compétences plus tôt que ne le suggèrent la plupart des tests. Elle a également mis en lumière la complexité de l'évaluation des capacités d'une IA. « Un modèle peut sembler incompétent face à des consignes standard, alors qu'il possède en réalité des capacités sophistiquées qui n'émergent que dans des conditions spécifiques », peut-on lire dans l'article.

Les recherches montrent que les modèles d'IA internalisent les concepts

Harvard et l'Université du Michigan ne sont pas les premières à s'intéresser aux capacités des modèles d'IA. Des chercheurs d'Anthropic ont récemment publié un article intitulé « Apprentissage de dictionnaires ». Cet article décrit comment ils établissent des liens entre le langage Claude et les concepts spécifiques qu'il comprend. Bien que la plupart de ces recherches aient adopté des approches différentes, leur objectif principal reste la compréhension des modèles d'IA.

Anthropic a révélé avoir identifié des caractéristiques pouvant être associées à différents concepts interprétables. « Nous avons trouvé des millions de caractéristiques qui semblent correspondre à des concepts interprétables, allant d'objets concrets comme les personnes, les pays et les bâtiments célèbres à des idéestraccomme les émotions, les styles d'écriture et les étapes de raisonnement », indique l'étude.

Au cours de leurs recherches, les chercheurs ont mené plusieurs expériences utilisant le modèle de diffusion, l'une des architectures les plus répandues en IA. Ils ont constaté que les modèles manipulaient les concepts de base de manières distinctes. Les schémas observés étaient cohérents : les modèles d'IA développaient de nouvelles capacités à différentes phases, avec un point de transition net signalant l'acquisition d'une nouvelle compétence.

Au cours de l'entraînement, les modèles ont démontré une maîtrise des concepts environ 2 000 étapes plus tôt qu'un test standard ne le permettrait. Les concepts les plustronsont apparus autour de 6 000 étapes, tandis que les plus faibles étaient visibles autour de 20 000 étapes. Après ajustement des signaux conceptuels, une corrélation directe avec la vitesse d'apprentissage a été mise en évidence.

Des chercheurs révèlent des méthodes pour accéder à des capacités cachées

Les chercheurs ont utilisé des méthodes d'incitation alternatives pour révéler des capacités cachées avant même qu'elles ne soient mises en évidence lors des tests standard. L'émergence rapide de ces capacités cachées a des répercussions sur l'évaluation et la sécurité de l'IA. Par exemple, les tests d'évaluation traditionnels peuvent passer à côté de certaines capacités des modèles d'IA, négligeant ainsi à la fois les aspects bénéfiques et les points faibles.

Au cours de leurs recherches, les chercheurs ont mis au point des méthodes permettant d'accéder aux capacités cachées des modèles d'IA. Ils ont nommé ces méthodes « intervention latente linéaire » et « sur-incitation », car les chercheurs ont amené les modèles à manifester des comportements complexes avant même qu'ils ne se révèlent lors des tests standard. Ils ont également découvert que les modèles d'IA manipulaient certaines caractéristiques complexes avant même de pouvoir les exprimer par le biais d'incitations standard.

Par exemple, on pourrait demander aux modèles de générer avec succès des « femmes souriantes » ou des « hommes portant des chapeaux » avant de leur demander de les combiner. Cependant, les recherches ont montré qu'ils ont appris à effectuer cette combinaison plus tôt, mais qu'ils sont incapables de la reproduire avec des instructions classiques. On peut dire que les modèles qui démontrent ces capacités sont en phase de « grokking », c'est-à-dire qu'ils affichent des performances parfaites lors des tests après un entraînement prolongé. Toutefois, les chercheurs ont indiqué qu'il existe des différences importantes entre les deux.

Bien que la compréhension approfondie des concepts (grokking) intervienne après plusieurs séances d'entraînement et implique le perfectionnement de différentes distributions des mêmes ensembles de données, la recherche montre que ces capacités émergent lors de l'apprentissage actif. Les chercheurs ont constaté que les modèles trouvaient de nouvelles façons de manipuler les concepts par le biais de changements de phases plutôt que par des améliorations progressives de la représentation lors de la compréhension approfondie.

D'après cette étude, les modèles d'IA connaissent ces concepts, mais sont incapables de les exprimer. C'est un peu comme si l'on regardait et comprenait un film étranger sans en parler la langue. Cela montre que la plupart des modèles possèdent des capacités supérieures à celles qu'ils manifestent, et illustre la difficulté à comprendre et à maîtriser ces capacités.

Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les!

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

PLUS D'ACTUALITÉS
COURS ACCÉLÉRÉ CRYPTOMONNAIES
LES