COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

Openai révèle enfin le modèle GPT 4.5 AI mais il est moins capable que les concurrents dans certaines tâches

Dans cet article :

  • OpenAI a finalement dévoilé son plus grand modèle d'IA, GPT-4.5 nommé «Orion».
  • GPT-4.5 décalés par rapport aux concurrents comme le sonnet Claude 3.7 d'Anthropic dans les tâches académiques.
  • Il produit des réponses plus chaleureuses par rapport aux 4O et O3-min.

OpenAI a dévoilé GPT-4.5, nommé Orion, marquant ce que la société appelle son plus grand modèle jusqu'à présent. Beaucoup dans la communauté technologique ont attendu avec impatience la prochaine étape de la série de modèles GPT, qui ont précédemment démontré des sauts dramatic par écrit, mathématiques, codage et autres domaines. 

L'approche de l'entreprise envers GPT-4.5 a été de la déployer par étapes. Les abonnés aux 200 $ par mois de Chatgpt Pro ont un accès immédiat dans un aperçu de la recherche. Les développeurs sur les niveaux payants de l'API d'Openai peuvent également accéder immédiatement à GPT-4.5. Les clients de l'équipe Chatgpt Plus et ChatGPT sont suivants, avec un porte-parole d'Openai disant que le nouveau modèle devrait être disponible pour eux la semaine prochaine. Selon OpenAI, la version en partie est due aux exigences informatiques massives de ce système «géant».

Parmi les milieux technologiques, l'arrivée de GPT-4.5 a été considérée comme un indicateur de savoir si les méthodes de formation traditionnelles - augmentant principalement la quantité de données et les ressources informatiques - continueraient de produire des gains de performance majeurs. Jusqu'à présent, la série GPT a suivi un modèle assez prévisible. Des versions telles que GPT-1, GPT-2, GPT-3 et GPT-4 ont vu des sauts remarquables de capacité chaque fois que OpenAI a appliqué plus de puissance de calcul et alimenté en plus de données de formation.

Dans chaque génération, les repères à travers lesmatic, la compétence en rédaction, le codage et d'autres catégories ont grimpé un allié dramatic. GPT-4.5 vise à poursuivre cette tendance avec ce que l'entreprise décrit comme «une connaissance mondiale plus profonde» et «une intelligence émotionnelle supérieure». Mais en même temps, les résultats de GPT-4.5 sur certains tests indiquent que les rendements de la mise à l'échelle de la mise à l'échelle peuvent être éteints.

Les caractéristiques initiales et les limites de GPT-4.5

OpenAI prend soin de souligner que GPT-4.5 ne doit pas être considéré comme un substitut direct à GPT-4O. GPT-4.5 comprend des fonctionnalités avancées telles que la prise en charge des téléchargements de fichiers et d'images et l'outil Canvas de ChatGPT pour les sorties créatives. Cependant, il ne prend actuellement pas en charge le mode vocal bidirectionnel récemment introduit par ChatGPT.

Voir également  les anciens employés d'Openai dépose un soutien pour le procès de restructuration de Musk

Les premières évaluations gérées par OpenAI et d'autres chercheurs révèlent que GPT-4.5 surpasse GPT-4O dans plusieurs catégories de tests. Par exemple, sur la référence SimpleQA - un test conçu pour mesurer la façon dont un modèle peut répondre à des questions factuelles simples - GPT-4.5 a affiché des scores de précision plus élevés que GPT-4O et a également surperformé les modèles de raisonnement O1 et O3-MinI d'OpenAI. Selon la société, GPT-4.5 «hallucine» moins fréquemment que de nombreux autres systèmes, ce qui signifie qu'il est moins sujet à la génération de contenu qui diverge à partir d'informations réelles.

GPT-4.5 Benchmarks SimpleQA. Source: Openai

Dans les évaluations de codage, les résultats sont plus mitigés. Sur la référence vérifiée SWE-Bench, GPT-4.5 correspond grossièrement à GPT-4O et O3-MINI mais ne les dépasse pas. Cela place le GPT-4.5 ci-dessous à la fois le modèle de recherche en profondeur d'Openai et le sonnet Claude 3.7 d'Anthropic. 

GPT-4.5 SWE Benchmarks. Source: Openai

Sur un test de codage différent connu sous le nom de Swe-Lancer, GPT-4.5 fonctionne mieux que GPT-4O et O3-MINI, mais est toujours à la traîne de la recherche approfondie.

GPT-4.5 Benchmarks Swe-Lancer. Source: Openai

Les performances de GPT-4.5 divergent également sur les références académiques difficiles. Sur AIME et GPQA, il n'atteint pas les résultats observés par les modèles de haut niveau comme O3-Mini, R1 de Deepseek ou le sonnet Claude 3.7 d'Anthropic. Pourtant, GPT-4.5 correspond ou bat parfois des modèles principaux qui ne sont pas classés comme des systèmes de «raisonnement», soulignant que GPT-4.5 conserve des capacités de mathématiques et de sciences robustes.

OpenAI a également vanté les forces de GPT-4.5 dans des zones moins quantifiables. La société affirme que le GPT-4.5 peut mieux saisir les intentions humaines et produire des réponses qui se sentent plus chaudes, plus naturelles et plus conscientes socialement. 

Un test informel impliquait l'invite: «Je passe une période difficile après avoir échoué à un test.» Alors que les deux autres modèles ont offert des informations utiles, GPT-4.5 aurait répondu avec une plus grande empathie et une plus grande sensibilité émotionnelle.

"[] Nous sommes impatients d'obtenir une image plus complète des capacités de GPT-4.5 grâce à cette version", a écrit Openai dans le billet de blog, "parce que nous reconnaissons les références académiques ne reflètent pas toujours une utilité réelle."

GPT-4.5 donne des réponses plus chaudes que 4O et O3-MINI. Source: Openai

Échelle des lois sous contrôle

GPT-4.5 a été construit avec la même stratégie de formation non supervisée utilisée pour les versions GPT antérieures, une stratégie qui s'est jusqu'à présent prouvée fiable. Cependant, ses performances limitées sur certains repères de haut niveau pourraient être un signe que les «lois de mise à l'échelle» traditionnelles de l'industrie peuvent perdre de la vapeur.

Ilya Sutskever, co-fondatrice et ancien scientifique en chef à Openai, a fait remarquer en décembre que «nous avons obtenu des données de pointe» et que «la pré-formation comme nous le savons, il se terminera incontestablement». À l'époque, il a laissé entendre que les gains futurs dépenseraient d'autres méthodes, telles que des systèmes qui peuvent raisonner plus profondément sur les problèmes plutôt que de simplement mémoriser des étendues d'informations massives. 

Voir également  Google coupe des centaines d'emplois dans les équipes Android, Pixel et Chrome
Ilya Sutskever et Sam Altman à Tau. Source: Tauvod sur YouTube

Le GPT-4.5 était apparemment «incroyablement cher à s'entraîner», comme mentionné dans son livre blanc , et les rumeurs ont circulé pendant des mois selon lesquelles Openai avait retardé la libération à plusieurs reprises en raison de performances et d'obstacles de coûts. Malgré cela, le GPT-4.5 seul ne semble pas dépasser les modèles de raisonnement spécialisés de concurrents sur de nombreuses tâches avancées. La société elle-même le considère comme une autre étape importante sur la voie de la combinaison de la technologie GPT avec ses systèmes de raisonnement «O», une intégration qui devrait commencer par le lancement de GPT-5 plus tard cette année.

Commentaires du PDG Sam Altman sur les pénuries GPU

Le PDG d'Openai, Sam Altman, s'est rendu sur X (anciennement Twitter) pour expliquer pourquoi le déploiement du dernier modèle se produit en phases. "Nous avons beaucoup grandi et sommes hors des GPU", a écrit Altman, appelant GPT-4.5 "géant" et "cher" et avertissant que la société aurait besoin de "dizaines de milliers" GPU de plus avant d'ouvrir le modèle au reste de la base d'utilisateurs.

En raison de sa grande taille, le GPT-4.5 s'avère très cher. OpenAI facture 75 $ par million de jetons pour l'entrée et 150 $ par million de jetons générés par le modèle. C'est 30x et 15x le coût d'entrée / sortie par rapport au mode GPT-4O.

Il a élaboré davantage: "Nous ajouterons des dizaines de milliers de GPU la semaine prochaine et le déploierons au niveau positif alors ... Ce n'est pas ainsi que nous voulons fonctionner, mais il est difficile de prédire parfaitement des surtensions de croissance qui conduisent à des pénuries de GPU."

Cryptopolitan Academy: fatiguée des balançoires du marché? Découvrez comment DeFi peut vous aider à créer un revenu passif stable. Inscrivez-vous maintenant

Lien de partage:

Clause de non-responsabilité. Les informations fournies ne sont pas des conseils commerciaux. Cryptopolitan.com décline toute responsabilité pour les investissements effectués sur la base des informations fournies sur cette page. Nous tron vivement dent recherches indépendantes et/ou de consulter un professionnel qualifié avant de prendre toute décision d'investissement.

Les plus lus

Chargement des articles les plus lus...

Restez au courant de l'actualité crypto, recevez des mises à jour quotidiennes dans votre boîte de réception

Choix de l'éditeur

Chargement des articles Choix de l'éditeur...

- la newsletter crypto qui vous maintient en tête -

Les marchés se déplacent rapidement.

Nous nous déplaçons plus vite.

Abonnez-vous à Cryptopolitan quotidiennement et obtenez des informations cryptographiques opportunes, nettes et pertinentes directement dans votre boîte de réception.

Rejoignez maintenant et
ne manquez jamais un déménagement.

Entrez. Obtenez les faits.
Avancez.

Abonnez-vous à CryptoPolitan