OpenAI a annoncé le déploiement de son modèle phare, GPT-4.1, sur ChatGPT. Ce modèle sera accessible à tous les utilisateurs payants et aux membres d'une équipe via le menu déroulant de sélection du modèle. OpenAI a précisé que les utilisateurs de la version gratuite ne sont pas concernés par ce déploiement, contrairement aux utilisateurs des versions Entreprise et Éducation.
GPT-4.0 mini sera remplacé par GPT-4.1 mini pour tous les utilisateurs, y compris ceux disposant d'un compte gratuit. Les utilisateurs ayant souscrit à une option payante verront également le modèle GPT-4.1 mini apparaître dans leur menu déroulant.
Selon OpenAI, GPT-4.1 mini et GPT-4.1 sont optimisés pour les tâches de codage et la réponse aux instructions améliorée, surpassant GPT-4.0.
Le modèle GPT-4.1 d'OpenAI surpasse le GPT-4.0 sur tous les plans
Selon OpenAI, le modèle GPT-4.1 offre une fenêtre de contexte plus large, prenant en charge jusqu'à un million de jetons de contexte et permettant une meilleure compréhension du contexte à long terme. La société d'IA ajoute que les ingénieurs logiciels tireront profit de l'utilisation de ce modèle pour le développement d'applications web.
Les notes de version d'OpenAI ont révélé que les ingénieurs peuvent utiliser le modèle pour exécuter des requêtes quotidiennes, des questions de suivi, du codage et d'autres tâches complexes.
La société d'IA dirigée par Sam Altman a déclaré que le modèle GPT-4.1 peut traiter des quantités massives de texte, d'images et de vidéos dans les instructions, contre une limite de 128 000 éléments pour GPT-4.0. Selon OpenAI , GPT-4.1 a obtenu un score de 54,6 % au test SWE-bench Verified, soit une amélioration de 21,4 % par rapport à GPT-4.0 et de 26,6 % par rapport à GPT-4.5, ce qui en fait le modèle de référence pour les tâches de programmation.
Sur le benchmark MultiChallenge de Scale, qui mesure la capacité à suivre des instructions, GPT-4.1 a obtenu un score de 38,3 %, soit une augmentation de 10,5 % par rapport à GPT-4.0. De plus, sur Video MME, un benchmark de compréhension multimodale de longs contextes, GPT-4.1 a obtenu un score très élevé de 72,0 % dans la catégorie « long sans sous-titres », soit une amélioration de 6,7 % par rapport à GPT-4.0.
OpenAI a révélé que les tests de performance fournissent des informations précieuses et que les modèles ont été entraînés en privilégiant les applications concrètes. L'entreprise a remercié la communauté des développeurs pour l'optimisation des modèles en vue de tâches complexes.
GPT-4.1 est livré sans rapport de sécurité
La communauté de recherche en IA a critiqué OpenAI pour avoir publié le modèle GPT-4.1 sans rapport de sécurité, affirmant que les normes de transparence des modèles d'OpenAI avaient été abaissées.
La société d'IA a fait valoir que, malgré des performances et une vitesse améliorées par rapport à GPT-4.0, le modèle n'exige pas les rapports de sécurité que les modèles plus avancés exigent, car il ne s'agit pas du modèle de pointe.
« GPT-4.1 n'introduit aucune nouvelle modalité ni aucun nouveau mode d'interaction avec le modèle, et son intelligence ne surpasse pas celle de GPT-3. Par conséquent, les considérations de sécurité, bien qu'importantes, diffèrent de celles des modèles de pointe. »
– Johannes Heidecke , responsable de la sécurité chez Open AI
L'entreprise spécialisée en intelligence artificielle a publié des informations supplémentaires concernant GPT-4.1 en réponse aux allégations relatives à sa sécurité. Mercredi, elle s'est engagée à publier rapidement les résultats de ses évaluations internes de sécurité des modèles, dans le cadre d'une démarche visant à accroître la transparence.
L'entreprise a révélé qu'elle met tout en œuvre pour se démarquer dans un secteur de plus en plus concurrentiel. La société spécialisée en IA serait sur le point d'annoncer l'acquisition de Windsurf, l'un des outils de programmation IA les plus réputés, pour 3 milliards de dollars. Windsurf est en concurrence avec Cursor, un autre outil de programmation IA populaire, et les solutions de programmation IA proposées par des entreprises comme Microsoft et Anthropic.
Andrej Karpathy, ancien fondateur d'OpenAI, a déclaré que Windsurf est un outil que les développeurs ont adopté en masse ces derniers mois pour assembler rapidement le code de nouveaux logiciels. Parmi les investisseurs de la startup figurent Founders Fund, General Catalyst, Greenoaks et Kleiner Perkins.
Google, de son côté, a mis à jour son chatbot Gemini pour faciliter sa connexion aux projets GitHub. Cette intégration fait suite au lancement par OpenAI d'un connecteur GitHub pour de ChatGPT . Cet outil de connexion GitHub explore le web et d'autres sources afin de compiler un rapport de recherche complet sur un sujet donné.
Mardi, OpenAI a également accueilli des connecteurs SharePoint et Microsoft OneDrive dans sa recherche approfondie ChatGPT.
Photo prise par Focal Foto via Flickr.