OpenAI a dévoilé GPT-4.5, nommé Orion, marquant ce que la société appelle son plus grand modèle jusqu'à présent. Beaucoup dans la communauté technologique ont attendu avec impatience la prochaine étape de la série de modèles GPT, qui ont précédemment démontré des sauts dramatic par écrit, mathématiques, codage et autres domaines.
L'approche de l'entreprise envers GPT-4.5 a été de la déployer par étapes. Les abonnés aux 200 $ par mois de Chatgpt Pro ont un accès immédiat dans un aperçu de la recherche. Les développeurs sur les niveaux payants de l'API d'Openai peuvent également accéder immédiatement à GPT-4.5. Les clients de l'équipe Chatgpt Plus et ChatGPT sont suivants, avec un porte-parole d'Openai disant que le nouveau modèle devrait être disponible pour eux la semaine prochaine. Selon OpenAI, la version en partie est due aux exigences informatiques massives de ce système «géant».
Aujourd'hui, nous publions un aperçu de recherche de GPT-4.5 - notre modèle le plus important et le meilleur pour le chat à ce jour.
— OpenAI (@OpenAI) 27 février 2025
Déplacement maintenant à tous les utilisateurs de Chatgpt Pro, suivis des utilisateurs de plus et de l'équipe la semaine prochaine, puis des utilisateurs de l'entreprise et de l'EDU la semaine suivante. pic.twitter.com/br5win5oeb
Parmi les milieux technologiques, l'arrivée de GPT-4.5 a été considérée comme un indicateur de savoir si les méthodes de formation traditionnelles - augmentant principalement la quantité de données et les ressources informatiques - continueraient de produire des gains de performance majeurs. Jusqu'à présent, la série GPT a suivi un modèle assez prévisible. Des versions telles que GPT-1, GPT-2, GPT-3 et GPT-4 ont vu des sauts remarquables de capacité chaque fois que OpenAI a appliqué plus de puissance de calcul et alimenté en plus de données de formation.
Dans chaque génération, les repères à travers lesmatic, la compétence en rédaction, le codage et d'autres catégories ont grimpé un allié dramatic. GPT-4.5 vise à poursuivre cette tendance avec ce que l'entreprise décrit comme «une connaissance mondiale plus profonde» et «une intelligence émotionnelle supérieure». Mais en même temps, les résultats de GPT-4.5 sur certains tests indiquent que les rendements de la mise à l'échelle de la mise à l'échelle peuvent être éteints.
Les caractéristiques initiales et les limites de GPT-4.5
OpenAI prend soin de souligner que GPT-4.5 ne doit pas être considéré comme un substitut direct à GPT-4O. GPT-4.5 comprend des fonctionnalités avancées telles que la prise en charge des téléchargements de fichiers et d'images et l'outil Canvas de ChatGPT pour les sorties créatives. Cependant, il ne prend actuellement pas en charge le mode vocal bidirectionnel récemment introduit par ChatGPT.
Les premières évaluations gérées par OpenAI et d'autres chercheurs révèlent que GPT-4.5 surpasse GPT-4O dans plusieurs catégories de tests. Par exemple, sur la référence SimpleQA - un test conçu pour mesurer la façon dont un modèle peut répondre à des questions factuelles simples - GPT-4.5 a affiché des scores de précision plus élevés que GPT-4O et a également surperformé les modèles de raisonnement O1 et O3-MinI d'OpenAI. Selon la société, GPT-4.5 «hallucine» moins fréquemment que de nombreux autres systèmes, ce qui signifie qu'il est moins sujet à la génération de contenu qui diverge à partir d'informations réelles.
Dans les évaluations de codage, les résultats sont plus mitigés. Sur la référence vérifiée SWE-Bench, GPT-4.5 correspond grossièrement à GPT-4O et O3-MINI mais ne les dépasse pas. Cela place le GPT-4.5 ci-dessous à la fois le modèle de recherche en profondeur d'Openai et le sonnet Claude 3.7 d'Anthropic.
Sur un test de codage différent connu sous le nom de Swe-Lancer, GPT-4.5 fonctionne mieux que GPT-4O et O3-MINI, mais est toujours à la traîne de la recherche approfondie.
Les performances de GPT-4.5 divergent également sur les références académiques difficiles. Sur AIME et GPQA, il n'atteint pas les résultats observés par les modèles de haut niveau comme O3-Mini, R1 de Deepseek ou le sonnet Claude 3.7 d'Anthropic. Pourtant, GPT-4.5 correspond ou bat parfois des modèles principaux qui ne sont pas classés comme des systèmes de «raisonnement», soulignant que GPT-4.5 conserve des capacités de mathématiques et de sciences robustes.
OpenAI a également vanté les forces de GPT-4.5 dans des zones moins quantifiables. La société affirme que le GPT-4.5 peut mieux saisir les intentions humaines et produire des réponses qui se sentent plus chaudes, plus naturelles et plus conscientes socialement.
Un test informel impliquait l'invite: «Je passe une période difficile après avoir échoué à un test.» Alors que les deux autres modèles ont offert des informations utiles, GPT-4.5 aurait répondu avec une plus grande empathie et une plus grande sensibilité émotionnelle.
"[] Nous sommes impatients d'obtenir une image plus complète des capacités de GPT-4.5 grâce à cette version", a écrit Openai dans le billet de blog, "parce que nous reconnaissons les références académiques ne reflètent pas toujours une utilité réelle."
Échelle des lois sous contrôle
GPT-4.5 a été construit avec la même stratégie de formation non supervisée utilisée pour les versions GPT antérieures, une stratégie qui s'est jusqu'à présent prouvée fiable. Cependant, ses performances limitées sur certains repères de haut niveau pourraient être un signe que les «lois de mise à l'échelle» traditionnelles de l'industrie peuvent perdre de la vapeur.
Ilya Sutskever, co-fondatrice et ancien scientifique en chef à Openai, a fait remarquer en décembre que «nous avons obtenu des données de pointe» et que «la pré-formation comme nous le savons, il se terminera incontestablement». À l'époque, il a laissé entendre que les gains futurs dépenseraient d'autres méthodes, telles que des systèmes qui peuvent raisonner plus profondément sur les problèmes plutôt que de simplement mémoriser des étendues d'informations massives.
Le GPT-4.5 était apparemment «incroyablement cher à s'entraîner», comme mentionné dans son livre blanc , et les rumeurs ont circulé pendant des mois selon lesquelles Openai avait retardé la libération à plusieurs reprises en raison de performances et d'obstacles de coûts. Malgré cela, le GPT-4.5 seul ne semble pas dépasser les modèles de raisonnement spécialisés de concurrents sur de nombreuses tâches avancées. La société elle-même le considère comme une autre étape importante sur la voie de la combinaison de la technologie GPT avec ses systèmes de raisonnement «O», une intégration qui devrait commencer par le lancement de GPT-5 plus tard cette année.
Commentaires du PDG Sam Altman sur les pénuries GPU
Le PDG d'Openai, Sam Altman, s'est rendu sur X (anciennement Twitter) pour expliquer pourquoi le déploiement du dernier modèle se produit en phases. "Nous avons beaucoup grandi et sommes hors des GPU", a écrit Altman, appelant GPT-4.5 "géant" et "cher" et avertissant que la société aurait besoin de "dizaines de milliers" GPU de plus avant d'ouvrir le modèle au reste de la base d'utilisateurs.
GPT-4.5 est prêt!
—Sam Altman (@sama) 27 février 2025
Bonne nouvelle: c'est le premier modèle qui a envie de me parler à une personne réfléchie. J'ai eu plusieurs instants où je me suis assis sur ma chaise et j'ai été étonné d'obtenir de bons conseils d'une IA.
Mauvaise nouvelle: c'est un modèle géant et cher. nous…
En raison de sa grande taille, le GPT-4.5 s'avère très cher. OpenAI facture 75 $ par million de jetons pour l'entrée et 150 $ par million de jetons générés par le modèle. C'est 30x et 15x le coût d'entrée / sortie par rapport au mode GPT-4O.
Il a élaboré davantage: "Nous ajouterons des dizaines de milliers de GPU la semaine prochaine et le déploierons au niveau positif alors ... Ce n'est pas ainsi que nous voulons fonctionner, mais il est difficile de prédire parfaitement des surtensions de croissance qui conduisent à des pénuries de GPU."
Cryptopolitan Academy: fatiguée des balançoires du marché? Découvrez comment DeFi peut vous aider à créer un revenu passif stable. Inscrivez-vous maintenant