L'agent Operator d'OpenAI bénéficie d'un coup de pouce grâce à un nouveau modèle d'IA

- OpenAI a mis à jour Operator, son agent d'IA qui utilise le web pour effectuer des tâches, vers un modèle basé sur o3 après avoir utilisé auparavant une version personnalisée de GPT-4o.
- L'opérateur o3 a été affiné avec des données de sécurité supplémentaires pour une utilisation informatique, y compris des ensembles de données de sécurité conçus pour enseigner au modèle les limites de décision.
- Mike Knoop, cofondateur de la Fondation Arc Prize, estime que la mise en œuvre du modèle o3 pourrait s'avérer plus coûteuse que prévu.
OpenAI a mis à jour le modèle d'IA qui alimente Operator, remplaçant la version personnalisée précédente de GPT-4o par un modèle basé sur o3, l'un des plus récents de la série o de modèles de raisonnement d'OpenAI. L'Operator o3 a été optimisé grâce à des données de sécurité supplémentaires pour une utilisation informatique et inclut des jeux de données de sécurité conçus pour lui apprendre les limites de décision.
OpenAI a mis à jour l'opérateur de ChatGPT avec un nouveau modèle d'agent utilisant un ordinateur (CUA) basé sur une version d'OpenAI o3. Grâce à ce nouveau modèle, l'opérateur est plus persévérant et plus précis dans ses interactions avec le navigateur, ce qui améliore le taux de réussite global des tâches. Il fournit également des réponses mieux structurées, plus claires et plus complètes.
Selon OpenAI, le nouveau modèle CUA a affiché destronà la moyenne du secteur, atteignant l'état de l'art sur OSWorld et WebArena. Il a également démontré destronà la version précédente, tant sur les benchmarks établis que lors des évaluations des préférences humaines.
OpenAI remplace le modèle basé sur GPT-4o par une version basée sur o3
OpenAI laisse entendre qu'une mise à jour majeure est prévue pour ChatGPT Operator Agent pic.twitter.com/iGPQp9butD
– SabatAge (@sabatage) 22 mai 2025
OpenAI a remplacé le modèle Operator existant, basé sur GPT-4o, par une version basée sur OpenAI o3, bien que l'API reste basée sur 4o. La société d'IA a également affirmé que l'Operator o3 utilise la même approche de sécurité multicouche que la version 4o.
Cependant, par rapport aux autres modèles de la famille o3, l'opérateur o3 a été affiné avec des données de sécurité supplémentaires pour une utilisation informatique, y compris des ensembles de données de sécurité conçus pour enseigner au modèle les limites de décision sur les confirmations et les refus.
OpenAI a publié un rapport technique présentant les performances de l'opérateur o3 lors d'évaluations de sécurité spécifiques. Comparé au modèle GPT-4o, l'opérateur o3 s'est montré moins susceptible de refuser d'effectuer des activités illicites et de rechercher des données personnelles sensibles, et moins vulnérable à une forme d'attaque par IA appelée « injection prompte ».
« o3 Operator utilise la même approche multicouche en matière de sécurité que celle utilisée pour la version 4o d'Operator… Bien que o3 Operator hérite des capacités de codage de o3, il ne dispose pas d'un accès natif à un environnement de codage ou à un terminal. »
La société spécialisée en IA a également indiqué que le nouveau modèle basé sur o3 avait subi les évaluations de sécurité standard et qu'Operator restait disponible en avant-première pour les utilisateurs de ChatGPT Pro du monde entier. Cependant, ce modèle amélioré était uniquement disponible dans Operator au sein de ChatGPT.
Knoop soupçonne que l'exécution du modèle o3 d'OpenAI pourrait coûter plus cher que prévu
La semaine dernière, la Fondation Arc Prize, qui gère et administre ARC-AGI, a mis à jour son estimation des coûts de calcul pour o3. L'organisation estimait initialement que la configuration la plus performante d'o3 qu'elle avait testée, o3 high, coûtait environ 3 000 $ pour résoudre un seul problème ARC-AGI. Cependant, la Fondation estime désormais que ce coût pourrait être dix fois supérieur, atteignant potentiellement 30 000 $ par tâche.
Bien qu'OpenAI n'ait pas encore communiqué le prix d'o3 ni même lancé sa version finale, Mike Knoop, cofondateur de la Fondation Arc Prize, estime que le prix du modèle o1-pro constitue une approximation raisonnable et permet une comparaison plus juste du coût réel d'o3. Il a toutefois précisé qu'o3 resterait présenté comme une version préliminaire dans le classement afin de refléter l'incertitude jusqu'à l'annonce officielle de son prix.
Selon la Fondation Arc Prize, un prix élevé pour o3 high ne serait pas surprenant, compte tenu des ressources de calcul considérables que ce modèle utiliserait. o3 high a utilisé 172 fois plus de puissance de calcul que o3 low, la configuration la moins gourmande en ressources de o3, pour résoudre le problème ARC-AGI.
, des rumeurs circulent concernant les offres onéreuses qu'OpenAI envisagerait de lancer pour les entreprises. Selon ces informations, la société pourrait facturer jusqu'à 20 000 $ par mois pour des « agents » d'IA spécialisés, tels que des agents pour développeurs de logiciels.
Cependant, si certains affirmaient que même les modèles les plus onéreux d'OpenAI coûteraient bien moins cher qu'untracou un employé humain classique, le chercheur en IA Toby Ord a souligné que ces modèles pourraient ne pas être aussi efficaces. Par exemple, le modèle o3 high a nécessité 1 024 tentatives pour chaque tâche du projet ARC-AGI afin d'obtenir son meilleur score.
Si vous lisez ceci, vous avez déjà une longueur d'avance. Restez-y grâce à notre newsletter.

Collins J. Okoth
Collins Okoth est journaliste et analyste de marché, fort de huit ans d'expérience dans le secteur des cryptomonnaies et des technologies. Analyste financier certifié, il est également titulaire d'un diplôme enmaticactuarielles. Collins a précédemment travaillé comme rédacteur et éditeur pour Geek Computer et CoinRabbit.
LES
- Quelles cryptomonnaies peuvent vous faire gagner de l'argent ?
- Comment renforcer la sécurité de votre portefeuille (et lesquels valent vraiment la peine d'être utilisés)
- Stratégies d'investissement peu connues utilisées par les professionnels
- Comment débuter en investissement crypto (quelles plateformes d'échange utiliser, quelles cryptomonnaies acheter, etc.)














