Le PDG d'OpenAI, Sam Altman, avait teasé GPT-5 pendant des mois. Il affirmait qu'il s'agissait d'un modèle avancé : plus intelligent, plus rapide et capable de raisonner au niveau d'un docteur en informatique. L'entreprise présentait ce lancement comme une avancée majeure pour ChatGPT, censée permettre d'améliorer l'intelligence en matière de codage, de raisonnement et de précision.
Mais les premières réactions dressent un tableau plus nuancé. Les développeurs ont salué la capacité du modèle à comprendre des requêtes complexes et à générer un code bien structuré. Simon Willison, l'un des premiers testeurs, a décrit GPT-5 comme « compétent » et « parfois impressionnant », mais sans pour autant le qualifier d'avancée majeure par rapport à GPT-4. D'autres se sont montrés moins enthousiastes.
Plusieurs publications sur les réseaux sociaux ont rapidement fait état de plaintes concernant de nombreuses erreurs factuelles, des lacunes en mathématiques et, dans certains cas, même des fautes d'orthographe élémentaires. Noah Giansiracusa, professeur de mathématiques à l'université Bentley, a qualifié la publication de « décevante », soulignant que les mises à jour en question lui semblaient « plus mineures que je ne l'aurais espéré »
Une partie de la confusion provenait de l'architecture du modèle. GPT-5 intégrait un système de commutation automatique pour taille aux différentestâches. Cela permettait d'économiser des ressources de traitement et d'éviter de solliciter systématiquement l'intégralité du modèle GPT-5, ce qui avait permis à de nombreuses personnes de le contourner. Lorsqu'un système a donné une réponse incorrecte à une question, l'agent avec lequel il collaborait lui a demandé de réfléchir davantage au nombre de lettres « b » dans le mot « myrtille ». Après ce retour d'information, le système a donné la bonne réponse à la question suivante.
Les utilisateurs protestent – et OpenAI réagit
La frustration pourrait bien se propager sur Reddit et X dès vendredi. Si certains utilisateurs déploraient l'impossibilité de connaître l'auteur du texte, ni même le modèle utilisé, beaucoup estimaient que l'enfer n'était qu'une supposition et que GPT-5 avait remplacé leurs anciens modèles préférés. Quelques-uns ont déploré une baisse de la qualité : l'écriture n'est pas aussi bonne qu'avec GPT-4.5(ce qui, de l'avis général, devrait être le cas), et certains aspects créatifs et techniques semblent moins performants.
Cette discussion a incité le PDG d'OpenAI à participer à une session de questions-réponses sur Reddit afin de répondre aux critiques. Il a expliqué qu'un bug dans le système de commutation automatique avait empêché GPT-5 d'atteindre son plein potentiel dès le premier jour. Il a promis plus de transparence lors des futures transitions de modèles : « À partir d'aujourd'hui, GPT-5 devrait paraître de plus en plus intelligent. » OpenAI s'est également engagé à redéployer des modèles plus anciens, comme GPT-4o, pour ceux qui en feraient la demande, une initiative visant à apaiser les critiques les plus virulentes.
Le fait qu'il ait fallu agir aussi vite souligne l'importance des enjeux. Aujourd'hui, OpenAI est engagée dans une course effrénée avec des concurrents tels qu'Anthropic, Google DeepMind et même xAI d'Elon Musk. Face à une telle concurrence, le moindre faux pas et votre concurrent prend rapidement l'avantage.
La compétition s'intensifie dans la course à l'IA
Malgré ces différences, l'accueil réservé à GPT-5 fut mitigé, ce qui ne l'empêcha pas d'atteindre la première place de LMArena, un classement participatif des modèles d'entraînement. Bien qu'il ne soit pas considéré comme programmable au sens actuel du terme, il était extrêmement rapide et expressif, capable de traiter des requêtes volumineuses et complexes. Cependant, d'autres tests de performance révélèrent un contexte différent et plus exigeant. Grok 4, développé par xAI d'Elon Musk, obtint un score si élevé à ARC-AGI-2 (un ensemble de tests de raisonnement avancé) qu'il représenta un défi de taille pour la suprématie d'OpenAI.
Certains analystes du secteur estiment qu'il faudra au moins une journée avant que les effets de GPT-5 ne soient pleinement compris, à l'instar des précédentes avancées de l'entreprise, telles que GPT-3. GPT-5 et GPT-4 avaient suscité de vives critiques avant de bénéficier d'améliorations grâce à des mises à jour et à d'autres cas d'utilisation. Le succès (ou l'échec) de ce modèle dépendra de son utilité dans le quotidien des utilisateurs, et ChatGPT compte près de 700 millions d'utilisateurs actifs hebdomadaires à travers le monde.
Selon Ethan Mollick, professeur à Wharton : « GPT-5 agit de façon autonome, réalisant parfois des choses étonnantes, parfois des choses déconcertantes. C’est ce qui le rend si fascinant. Qualifier d’« intéressant » un aspect comme celui-ci du domaine de la santé publique reste une approche technocratique, voire un peu inquiétante. »

