DERNIÈRES NOUVELLES

La Fondation Ethereum prolonge la chute des ventes d'ETH tandis que Bitmine continue d'acheter à la baisse

d'il y a 4 heures Actualités
Hong Kong fait progresser les stablecoins agréés avec le lancement d'une plateforme anti-fraude basée sur l'IA

d'il y a 5 heures Actualités
Pourquoi l'action de GameStop a-t-elle soudainement grimpé de 13 % ?

Il y a 7 heures - Entreprise
L'utilisation des stablecoins explose, mais JPMorgan affirme que la taille ne fait pas tout

Il y a 8 heures Économie

SÉLECTIONNÉ POUR VOUS

La Fondation Ethereum prolonge la chute des ventes d'ETH tandis que Bitmine continue d'acheter à la baisse

d'il y a 4 heures Actualités
Hong Kong fait progresser les stablecoins agréés avec le lancement d'une plateforme anti-fraude basée sur l'IA

d'il y a 5 heures Actualités
Pourquoi l'action de GameStop a-t-elle soudainement grimpé de 13 % ?

Il y a 7 heures - Entreprise

HEBDOMADAIRE

RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Nouvelles

Les modèles d'IA maîtrisent des capacités bien avant de les manifester, selon une étude

Par

Owotunse Adebayo

3 minutes de lecture 24 novembre 2024

Les modèles d'IA maîtrisent des capacités bien avant de les manifester, selon une étude

Des recherches ont montré que les modèles d'IA maîtrisent des capacités bien avant de les manifester.
Les chercheurs affirment que ces modèles peuvent intérioriser des concepts bien avant de les manifester.
Des chercheurs dévoilent différentes méthodes pour révéler des capacités cachées.

De nouvelles recherches ont démontré que les modèles d'intelligence artificielle (IA) possèdent certaines capacités bien avant de les manifester lors de leur apprentissage. Selon cette étude menée par Harvard et l'Université du Michigan, les modèles ne révèlent ces aptitudes que lorsqu'ils en ont besoin, d'une manière ou d'une autre.

Cette recherche fait partie des nombreuses études menées pour comprendre comment les modèles d'IA développent leurs capacités avant de les présenter.

L' étude a analysé comment les modèles d'IA apprennent des concepts de base comme la taille et la couleur, révélant qu'ils maîtrisent ces compétences plus tôt que ne le suggèrent la plupart des tests. Elle a également mis en lumière la complexité de l'évaluation des capacités d'une IA. « Un modèle peut sembler incompétent face à des consignes standard, alors qu'il possède en réalité des capacités sophistiquées qui n'émergent que dans des conditions spécifiques », peut-on lire dans l'article.

Les recherches montrent que les modèles d'IA internalisent les concepts

Harvard et l'Université du Michigan ne sont pas les premières à s'intéresser aux capacités des modèles d'IA. Des chercheurs d'Anthropic ont récemment publié un article intitulé « Apprentissage de dictionnaires ». Cet article décrit comment ils établissent des liens entre le langage Claude et les concepts spécifiques qu'il comprend. Bien que la plupart de ces recherches aient adopté des approches différentes, leur objectif principal reste la compréhension des modèles d'IA.

Anthropic a révélé avoir identifié des caractéristiques pouvant être associées à différents concepts interprétables. « Nous avons trouvé des millions de caractéristiques qui semblent correspondre à des concepts interprétables, allant d'objets concrets comme les personnes, les pays et les bâtiments célèbres à des idéestraccomme les émotions, les styles d'écriture et les étapes de raisonnement », indique l'étude.

Au cours de leurs recherches, les chercheurs ont mené plusieurs expériences utilisant le modèle de diffusion, l'une des architectures les plus répandues en IA. Ils ont constaté que les modèles manipulaient les concepts de base de manières distinctes. Les schémas observés étaient cohérents : les modèles d'IA développaient de nouvelles capacités à différentes phases, avec un point de transition net signalant l'acquisition d'une nouvelle compétence.

Au cours de l'entraînement, les modèles ont démontré une maîtrise des concepts environ 2 000 étapes plus tôt qu'un test standard ne le permettrait. Les concepts les plustronsont apparus autour de 6 000 étapes, tandis que les plus faibles étaient visibles autour de 20 000 étapes. Après ajustement des signaux conceptuels, une corrélation directe avec la vitesse d'apprentissage a été mise en évidence.

Des chercheurs révèlent des méthodes pour accéder à des capacités cachées

Les chercheurs ont utilisé des méthodes d'incitation alternatives pour révéler des capacités cachées avant même qu'elles ne soient mises en évidence lors des tests standard. L'émergence rapide de ces capacités cachées a des répercussions sur l'évaluation et la sécurité de l'IA. Par exemple, les tests d'évaluation traditionnels peuvent passer à côté de certaines capacités des modèles d'IA, négligeant ainsi à la fois les aspects bénéfiques et les points faibles.

Au cours de leurs recherches, les chercheurs ont mis au point des méthodes permettant d'accéder aux capacités cachées des modèles d'IA. Ils ont nommé ces méthodes « intervention latente linéaire » et « sur-incitation », car les chercheurs ont amené les modèles à manifester des comportements complexes avant même qu'ils ne se révèlent lors des tests standard. Ils ont également découvert que les modèles d'IA manipulaient certaines caractéristiques complexes avant même de pouvoir les exprimer par le biais d'incitations standard.

Par exemple, on pourrait demander aux modèles de générer avec succès des « femmes souriantes » ou des « hommes portant des chapeaux » avant de leur demander de les combiner. Cependant, les recherches ont montré qu'ils ont appris à effectuer cette combinaison plus tôt, mais qu'ils sont incapables de la reproduire avec des instructions classiques. On peut dire que les modèles qui démontrent ces capacités sont en phase de « grokking », c'est-à-dire qu'ils affichent des performances parfaites lors des tests après un entraînement prolongé. Toutefois, les chercheurs ont indiqué qu'il existe des différences importantes entre les deux.

Bien que la compréhension approfondie des concepts (grokking) intervienne après plusieurs séances d'entraînement et implique le perfectionnement de différentes distributions des mêmes ensembles de données, la recherche montre que ces capacités émergent lors de l'apprentissage actif. Les chercheurs ont constaté que les modèles trouvaient de nouvelles façons de manipuler les concepts par le biais de changements de phases plutôt que par des améliorations progressives de la représentation lors de la compréhension approfondie.

D'après cette étude, les modèles d'IA connaissent ces concepts, mais sont incapables de les exprimer. C'est un peu comme si l'on regardait et comprenait un film étranger sans en parler la langue. Cela montre que la plupart des modèles possèdent des capacités supérieures à celles qu'ils manifestent, et illustre la difficulté à comprendre et à maîtriser ces capacités.

Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les!

États-Unis

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustrondentdentdentdentdentdentdentdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Owotunse Adebayo

Adebayo est un rédacteur spécialisé dans le secteur des cryptomonnaies depuis quatre ans. Diplômé de l'Université de Lagos en urbanisme et aménagement du territoire, il a travaillé chez Tokenhell et CryptoTicker, où il rédigeait des articles sur l'actualité des cryptomonnaies et de la fintech. Il collabore actuellement avec Cryptopolitan.

TABLE DES MATIÈRES

1. Les recherches montrent que les modèles d'IA internalisent les concepts

2. Des chercheurs révèlent des méthodes pour accéder à des capacités cachées

Partagez cet article

PLUS D'ACTUALITÉS

AFFICHER TOUT

5 applications ingénieuses de ChatGPT et ce que vous devriez en faire

Il y a 3 ans, technicien John Palmer,

93 % des dirigeants d'entreprise privilégient les solutions basées sur l'IA pour la gestion de la durabilité de leur marque (Reuters)

Il y a 3 ans, technicien John Palmer,

Voici comment Macron soutient l'écosystème d'IA dynamique et productif de la France

Il y a 3 ans, Tech Glory Kaburu

Bloomberg estime que le marché de l'IA générative atteindra 1 300 milliards de dollars d'ici 2032

Il y a 3 ans, Tech Aamir Sheikh

Base est-il le réseau Ethereum de couche 2 lancé par Coinbase ?

21 octobre 2025 Apprendre la crypto : Guides pour débutants
Dogecoin contre Bitcoin: Principales différences techniques

20 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce que la TVL (Total Value Locked) en cryptomonnaie ?

14 octobre 2025 Apprendre la crypto : Guides pour débutants
Comment lire un livre blanc sur les cryptomonnaies ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Ripple vs. XRP vs. XRP Ledger : quelle est la différence ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce qu'un portefeuille multisignature dans le monde des cryptomonnaies ?

10 octobre 2025 Apprendre la crypto : Guides pour débutants

COURS ACCÉLÉRÉ CRYPTOMONNAIES
LES

Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
Stratégies d'investissement peu connues utilisées par les professionnels
Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)