OpenAI dévoile enfin le modèle d'IA GPT 4.5, mais ses performances sont inférieures à celles de ses concurrents dans certaines tâches

Par

Shummas Humayun

4 minutes de lecture - 1er mars 2025

OpenAI a enfin dévoilé son plus grand modèle d'IA, GPT-4.5, nom de code « Orion ».
GPT-4.5 est à la traîne par rapport à ses concurrents comme Claude 3.7 Sonnet d'Anthropic dans les tâches académiques.
Il produit des réponses plus chaleureuses que les modèles 4o et o3-mini.

OpenAI a dévoilé GPT-4.5, nom de code Orion, qu'elle présente comme son plus grand modèle à ce jour. Nombreux étaient ceux, dans la communauté technologique, qui attendaient avec impatience cette nouvelle étape de la série des modèles GPT, lesquels ont déjà démontré des progrèsmatic en écriture, en mathématiques, en programmation et dans d'autres domaines.

L'approche d'OpenAI concernant GPT-4.5 consiste à le déployer progressivement. Les abonnés à ChatGPT Pro (200 $ par mois) bénéficient d'un accès immédiat à une version préliminaire réservée à la recherche. Les développeurs disposant d'une version payante de l'API d'OpenAI peuvent également accéder à GPT-4.5 sans délai. Les clients de ChatGPT Plus et ChatGPT Team suivront, un porte-parole d'OpenAI indiquant que le nouveau modèle devrait leur être disponible la semaine prochaine. Ce déploiement progressif, selon OpenAI, est en partie dû aux exigences de calcul considérables que requiert ce système complexe.

Aujourd'hui, nous publions un aperçu de GPT-4.5 pour la recherche — notre modèle de chat le plus performant et le plus complet à ce jour.

Disponible dès maintenant pour tous les utilisateurs de ChatGPT Pro, puis pour les utilisateurs de Plus et Team la semaine prochaine, et enfin pour les utilisateurs d'Enterprise et d'Edu la semaine suivante. pic.twitter.com/br5win5OEB
— OpenAI (@OpenAI) 27 février 2025

Dans le milieu technologique, l'arrivée de GPT-4.5 a été perçue comme un indicateur permettant de déterminer si les méthodes d'entraînement traditionnelles — principalement l'augmentation du volume de données et des ressources de calcul — continueraient à produire des gains de performance significatifs. Jusqu'à présent, la série GPT a suivi une évolution assez prévisible. Les versions GPT-1, GPT-2, GPT-3 et GPT-4 ont connu des progrès remarquables à chaque fois qu'OpenAI a augmenté sa puissance de calcul et alimenté ses données d'entraînement.

À chaque génération, les performances enmatic, en expression écrite, en programmation et dans d'autres domaines ont connu une progressionmatic. GPT-4.5 vise à poursuivre cette tendance grâce à ce que l'entreprise décrit comme une « connaissance du monde plus approfondie » et une « intelligence émotionnelle plus élevée ». Cependant, les résultats de GPT-4.5 sur certains tests indiquent que les gains liés à une simple augmentation de la taille des systèmes pourraient atteindre un plateau.

Caractéristiques et limitations initiales de GPT-4.5

OpenAI tient à préciser que GPT-4.5 ne doit pas être considéré comme un substitut direct de GPT-40. GPT-4.5 intègre des fonctionnalités avancées telles que la prise en charge du téléchargement de fichiers et d'images, ainsi que l'outil Canvas de ChatGPT pour les créations artistiques. Cependant, il ne prend pas encore en charge le mode vocal bidirectionnel récemment introduit par ChatGPT.

Les premières évaluations menées par OpenAI et d'autres chercheurs révèlent que GPT-4.5 surpasse GPT-4o dans plusieurs catégories de tests. Par exemple, sur le benchmark SimpleQA (un test conçu pour mesurer la capacité d'un modèle à répondre à des questions factuelles simples), GPT-4.5 a obtenu des scores de précision supérieurs à ceux de GPT-4o et a également surpassé les modèles de raisonnement o1 et o3-mini d'OpenAI. Selon l'entreprise, GPT-4.5 « hallucine » moins fréquemment que de nombreux autres systèmes, ce qui signifie qu'il est moins susceptible de générer un contenu qui s'écarte des informations réelles.

Résultats des tests de performance de GPT-4.5 SimpleQA. Source : OpenAI

En matière d'évaluation de la programmation, les résultats sont plus mitigés. Sur le benchmark SWE-Bench Verified, GPT-4.5 se situe à peu près au même niveau que GPT-4o et o3-mini, sans toutefois les surpasser. Il se trouve ainsi en dessous du modèle de recherche approfondie d'OpenAI et de Claude 3.7 Sonnet d'Anthropic.

Performances de GPT-4.5 SWE. Source : OpenAI

Sur un autre test de codage appelé SWE-Lancer, GPT-4.5 est plus performant que GPT-4o et o3-mini, mais reste en deçà de la recherche approfondie.

Benchmarks GPT-4.5 SWE-Lancer. Source : OpenAI

Les performances de GPT-4.5 divergent également sur les benchmarks académiques exigeants. Sur AIME et GPQA, il n'atteint pas les résultats de modèles de pointe comme o3-mini, R1 de DeepSeek ou Claude 3.7 Sonnet d'Anthropic. Cependant, GPT-4.5 égale, voire surpasse parfois, les meilleurs modèles qui ne sont pas classés comme systèmes de « raisonnement », ce qui souligne ses solides capacités en mathématiques et en sciences.

OpenAI a également mis en avant les atouts de GPT-4.5 dans des domaines moins quantifiables. L'entreprise affirme que GPT-4.5 est capable de mieux saisir les intentions humaines et de produire des réponses plus chaleureuses, plus naturelles et plus adaptées aux interactions sociales.

Un test informel consistait à utiliser la phrase suivante : « Je traverse une période difficile après avoir échoué à un examen. » Alors que les deux autres modèles fournissaient des informations utiles, GPT-4.5 aurait réagi avec une plus grande empathie et une plus grande sensibilité émotionnelle.

« Nous espérons que cette nouvelle version nous permettra d'avoir une vision plus complète des capacités de GPT-4.5 », a écrit OpenAI dans son article de blog, « car nous savons que les critères d'évaluation académiques ne reflètent pas toujours l'utilité dans le monde réel. »

GPT-4.5 donne des réponses plus nuancées que 4o et o3-mini. Source : OpenAI

Les lois sur le dimensionnement font l'objet d'un examen minutieux

GPT-4.5 a été conçu avec la même stratégie d'apprentissage non supervisé que les versions précédentes de GPT, une stratégie qui s'est avérée fiable jusqu'à présent. Cependant, ses performances limitées sur certains benchmarks de haut niveau pourraient indiquer que les lois de passage à l'échelle traditionnelles du secteur sont en perte de vitesse.

Ilya Sutskever, cofondateur et ancien directeur scientifique d'OpenAI, a déclaré en décembre que « nous avons atteint le pic des données » et que « le pré-entraînement tel que nous le connaissons prendra fin sans aucun doute ». À l'époque, il laissait entendre que les progrès futurs dépendraient d'autres méthodes, comme des systèmes capables de raisonner plus profondément sur les problèmes plutôt que de simplement mémoriser d'énormes quantités d'informations.

Ilya Sutskever et Sam Altman à l'Université de Tel Aviv. Source : TAUVOD sur YouTube

L'entraînement de GPT-4.5 s'est avéré extrêmement coûteux, comme indiqué dans son livre blanc, et des rumeurs ont circulé pendant des mois selon lesquelles OpenAI aurait reporté sa sortie à plusieurs reprises en raison de problèmes de performance et de coûts. Malgré cela, GPT-4.5, à lui seul, ne semble pas surpasser les modèles de raisonnement spécialisés de ses concurrents sur de nombreuses tâches complexes. L'entreprise le considère comme une nouvelle étape importante dans son développement, en vue de combiner la technologie GPT avec ses systèmes de raisonnement « o », une intégration qui devrait débuter avec le lancement de GPT-5 plus tard cette année.

Déclarations du PDG Sam Altman concernant les pénuries de GPU

Le PDG d'OpenAI, Sam Altman, a utilisé X (anciennement Twitter) pour expliquer le déploiement progressif du dernier modèle. « Notre croissance est importante et nous sommes à court de GPU », a-t-il écrit, qualifiant GPT-4.5 de « géant » et « coûteux », et prévenant que l'entreprise aurait besoin de « dizaines de milliers » de GPU supplémentaires avant de rendre le modèle accessible au reste des utilisateurs.

GPT-4.5 est prêt !

Bonne nouvelle : c’est le premier modèle qui me donne l’impression de parler à une personne réfléchie. À plusieurs reprises, j’ai été stupéfait de recevoir d’aussi bons conseils d’une IA.

Mauvaise nouvelle : c’est un modèle gigantesque et coûteux. Nous…
— Sam Altman (@sama) 27 février 2025

En raison de sa taille importante, GPT-4.5 s'avère très coûteux. OpenAI facture 75 $ par million de jetons pour les données d'entrée et 150 $ par million de jetons générés par le modèle. Cela représente respectivement 30 et 15 fois le coût des données d'entrée et de sortie par rapport au modèle GPT-4.0.

Il a précisé : « Nous ajouterons des dizaines de milliers de GPU la semaine prochaine et les déploierons ensuite sur le niveau Plus… Ce n’est pas ainsi que nous souhaitons fonctionner, mais il est difficile de prévoir parfaitement les pics de croissance qui entraînent des pénuries de GPU. »

Ne vous contentez pas de lire les actualités crypto. Comprenez-les. Abonnez-vous à notre newsletter. C'est gratuit.

OpenAI

Partagez cet article

Avertissement : Les informations fournies ne constituent pas un conseil en investissement. CryptopolitanCryptopolitan.com toute responsabilité quant aux investissements réalisés sur la base des informations présentées sur cette page. Nous voustronrecommandons vivement d’effectuer vosdent et/ou de consulter un professionnel qualifié avant toute décision d’investissement.

Shummas Humayun

Shummas est une ancienne rédactrice de contenu technique et chercheuse.

TABLE DES MATIÈRES

1. Caractéristiques et limitations initiales de GPT-4.5

2. Les lois sur le dimensionnement font l'objet d'un examen minutieux

3. Déclarations du PDG Sam Altman concernant les pénuries de GPU

Partagez cet article