DERNIÈRES NOUVELLES

La hausse de 60 % des exportations sud-coréennes attire des milliards de dollars du secteur des cryptomonnaies

Il y a 1 heure Économie
Pour la toute première fois, les élus républicains américains dépassent les démocrates en termes de possession de cryptomonnaies

Actualités d'il y a 9 heures
Trump veut sa part du gâteau de l'IA, mais personne ne s'accorde sur la manière dont il va

Il y a 10 heures - Technologie
Polymarket fait l'objet d'une enquête du WSJ alors que les marchés de prédiction atteignent un record de 1,48 milliard de dollars d'intérêts ouverts

Actualités d'il y a 16 heures

SÉLECTIONNÉ POUR VOUS

HEBDOMADAIRE

RESTEZ AU SOMMET

Les meilleures analyses crypto directement dans votre boîte mail.

Des chercheurs de Stanford et de l'Université de Washington développent un concurrent open source de ChatGPT à 50 dollars

Par

Jai Hamid

3 minutes de lecture 6 février 2025

Stanford et l'Université de Washington ont construit un modèle d'IA appelé s1 pour seulement 50 dollars, rivalisant avec o1 d'OpenAI dans les tests de mathématiques, de logique et de programmation.
L'équipe a utilisé le modèle Gemini 2.0 de Google grâce à une méthode d'entraînement peu coûteuse appelée distillation et a partagé l'ensemble du code source en open source sur GitHub.
Les grands acteurs comme OpenAI ne sont pas contents, craignant que des répliques à bas coût ne perturbent leurs investissements de plusieurs milliards de dollars.

Des chercheurs en IA de Stanford et de l'Université de Washington auraient réussi ce que personne ne pensait possible : ils ont construit un modèle d'IA appelé s1 pour moins de 50 dollars en crédits de cloud computing, selon un rapport de recherche publié lundi.

Le modèle s1 offrirait des performances équivalentes à celles des meilleurs modèles de raisonnement, tels que o1 d'OpenAI et R1 de DeepSeek, d'après des tests de mathématiques et de programmation. Mieux encore, le projet complet est disponible sur GitHub : code, données et tout le reste.

L'équipe a commencé par utiliser un modèle existant plutôt que d'en créer un nouveau. Elle l'a ensuite affiné grâce à un processus appelé distillation. Selon leurs recherches, ils ont extrait la puissance de raisonnement du modèle expérimental Gemini 2.0 Flash Thinking de Google.

Ils ont entraîné s1 à imiter les techniques de résolution de problèmes de Gemini en apprenant de ses réponses. « Nous avons visé la simplicité », a déclaré Niklas Muennighoff, l'un des chercheurs de Stanford impliqués dans le projet.

Petit ensemble de données, grands résultats

La distillation s'impose rapidement comme une méthode de prédilection pour les équipes d'IA cherchant à réduire leurs coûts. Un modèle d'IA similaire, développé le mois dernier par des chercheurs de Berkeley, a coûté 450 dollars à entraîner, un prix encore bas selon les normes du secteur. Mais Stanford et l'Université de Washington sont allés encore plus loin, en réduisant les coûts à environ 50 dollars grâce à la distillation de leur modèle à l'aide d'un ensemble de données plus restreint et de techniques optimisées.

Les chercheurs ont sélectionné avec soin seulement 1 000 questions, chacune associée à des réponses détaillées et à un raisonnement étape par étape tiré de Gemini 2.0 de Google. Cet ensemble de données a fourni à s1 toutes les connaissances nécessaires pour atteindre un haut niveau de performance. D'après l'article de l'équipe, le modèle a appris à résoudre les problèmes par le raisonnement.

Le réglage fin supervisé (SFT) a été essentiel à la réussite de ce projet. Au lieu d'utiliser l'apprentissage par renforcement, qui exige d'immenses ensembles de données et une puissance de calcul considérable, les chercheurs ont opté pour le SFT, une méthode où l'IA est directement entraînée à imiter les comportements observés dans l'ensemble de données. Cette méthode est moins coûteuse et plus rapide, et dans ce cas précis, elle a fait ses preuves.

Le modèle de base provenait de Qwen, le laboratoire d'IA d'Alibaba. Ce modèle prêt à l'emploi était téléchargeable gratuitement, ce qui a permis de réduire considérablement le coût du projet. En moins de 30 minutes et avec seulement 16 GPU Nvidia H100, l'équipe a terminé l'entraînement de s1. « Nous pourrions louer la puissance de calcul nécessaire pour environ 20 dollars aujourd'hui », a déclaré Muennighoff.

La commande « Attendre » a amélioré la précision de s1

Les chercheurs auraient utilisé une astuce ingénieuse pour améliorer le raisonnement de s1 : ils ont ajouté le mot « attendre » lors de la résolution de problèmes. En demandant au modèle de faire une pause et de revérifier son travail, ils ont accru sa précision. L’article de recherche explique en détail comment cette modification a permis à s1 de prendre le temps d’envisager de meilleures réponses avant de les soumettre.

OpenAI surveille la situation de près. L'organisation a déjà accusé DeepSeek d'avoir collecté illégalement des données via son API pour développer des concurrents en IA. Face à la démonstration par s1 de la facilité de réplication des modèles, les grands acteurs comme OpenAI sont loin d'être satisfaits. La banalisation des modèles d'IA pourrait impacter négativement leurs résultats financiers.

Mais l'entreprise technologique a d'autres problèmes. Mardi, l'équipe juridique d'Elon Musk a affronté OpenAI devant un tribunal fédéral d'Oakland. Elon, qui a été l'un des premiers investisseurs d'OpenAI, affirme que l'entreprise a abandonné sa mission à but non lucratif et trahi ses objectifs initiaux.

Il intente une action en justice pour empêcher leur transformation en une entreprise à but lucratif. L'avocat d'Elon, Marc Toberoff, a déclaré vendredi devant le tribunal qu'Elon avait investi 45 millions de dollars dans OpenAI entre sa création et 2018 car il était convaincu que l'entreprise privilégierait toujours l'intérêt public aux profits, comme elle l'avait affirmé dès le départ.

La juge Yvonne Gonzalez Rogers a qualifié l'opération d'« exagérée » et s'est demandée pourquoi Elon Musk aurait investi une telle somme sanstracécrit. « C'est une somme considérable sur la base d'une simple poignée de main », a-t-elle ironisé. L'avocat Toberoff a alors expliqué qu'Elon Musk et le PDG d'OpenAI, Sam Altman, entretenaient une relation étroite à l'époque, et que tout reposait sur la confiance.

L'affaire n'est cependant pas close. Le juge s'inquiète des liens étroits qui unissent OpenAI à Microsoft. Deux figures clés – Reid Hoffman, cofondateur de LinkedIn, et Deanna Templeton, cadre chez Microsoft – siégeaient au conseil d'administration d'OpenAI. Templeton y a été nommée membre sans droit de vote après le bref départ d'Altman en 2023, avant d'être destituée pour des raisons de concurrence.

Elon Musk souhaite bloquer leurs projets et potentiellement accroître son contrôle sur l'entreprise via sa propre filiale d'IA, xAI, qu'il a ajoutée comme partie plaignante dans cette affaire. OpenAI rétorque que la demande d'Elon Muskripple ses activités et repose sur des allégations extravagantes.

Les plus grands experts en cryptomonnaies lisent déjà notre newsletter. Envie d'en faire partie ? Rejoignez-les !

ChatGPT Gemini OpenAI

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Jai Hamid

Jai Hamid couvre l'actualité des cryptomonnaies, des marchés boursiers, des technologies, de l'économie mondiale et des événements géopolitiques qui influencent les marchés depuis six ans. Elle a collaboré avec des publications spécialisées dans la blockchain, telles que AMB Crypto, Coin Edition et CryptoTale, sur des analyses de marché, des sujets liés aux grandes entreprises, à la réglementation et aux tendances macroéconomiques. Diplômée de la London School of Journalism, elle a également présenté à trois reprises son expertise du marché des cryptomonnaies sur l'une des principales chaînes de télévision africaines.

TABLE DES MATIÈRES

1. Petit ensemble de données, grands résultats

2. La commande « Attendre » a amélioré la précision de s1

Partagez cet article

PLUS D'ACTUALITÉS

AFFICHER TOUT

5 applications ingénieuses de ChatGPT et ce que vous devriez en faire

Il y a 3 ans, John Palmer, technicien

93 % des dirigeants d'entreprise privilégient les solutions basées sur l'IA pour la gestion de la durabilité de leur marque (Reuters)

Il y a 3 ans, John Palmer, technicien

Voici comment Macron soutient l'écosystème d'IA dynamique et productif de la France

Il y a 3 ans, Tech Glory Kaburu

Bloomberg estime que le marché de l'IA générative atteindra 1 300 milliards de dollars d'ici 2032

Il y a 3 ans, Tech Aamir Sheikh

Base est-il le réseau Ethereum de couche 2 lancé par Coinbase ?

21 octobre 2025 Apprendre la crypto : Guides pour débutants
Dogecoin contre Bitcoin: Principales différences techniques

20 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce que la TVL (Total Value Locked) en cryptomonnaie ?

14 octobre 2025 Apprendre la crypto : Guides pour débutants
Comment lire un livre blanc sur les cryptomonnaies ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Ripple vs. XRP vs. XRP Ledger : quelle est la différence ?

13 octobre 2025 Apprendre la crypto : Guides pour débutants
Qu'est-ce qu'un portefeuille multisignature dans le monde des cryptomonnaies ?

10 octobre 2025 Apprendre la crypto : Guides pour débutants

COURS ACCÉLÉRÉ SUR LES CRYPTOMONNAIES

Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
Stratégies d'investissement peu connues utilisées par les professionnels
Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)