OpenAI a mis à jour l'opérateur d'alimentation du modèle AI de la version personnalisée précédente de GPT-4O vers un modèle basé sur O3, l'un des derniers modèles O d'Openai de «raisonnement». L'opérateur O3 a été affiné avec des données de sécurité supplémentaires pour l'utilisation de l'ordinateur et comprenait des ensembles de données de sécurité conçus pour enseigner les limites de décision du modèle.
OpenAI a mis à niveau l'opérateur dans Chatgpt avec un nouveau modèle d'agent d'utilisation informatique (CUA) basé sur une version d'OpenAI O3. Avec le nouveau modèle, l'opérateur est devenu plus persistant et plus précis lors de l'interaction avec le navigateur, améliorant le taux global de réussite des tâches. Il offre également des réponses mieux structurées qui sont plus claires et plus approfondies.
Selon Openai , le nouveau modèle CUA a montré tron gel par rapport à l'industrie, en réalisant Sota sur Osworld et webarena. Il a également montré tron Ger à la version précédente, à la fois dans les références établies et les évaluations des préférences humaines.
OpenAI remplace le modèle basé sur GPT-4O par une version basée sur O3
Openai Insignes lors d'une grande mise à niveau pour l'agent opérateur de chatppt pic.twitter.com/igpqp9butd
- Sabatage (@sabatage) 22 mai 2025
OpenAI a remplacé le modèle existant basé sur GPT - 4O pour l'opérateur par une version basée sur OpenAI O3, bien que la version API restera basée sur 4O. La société d'IA a également affirmé que l'opérateur O3 utilise la même approche de sécurité multicouche utilisée pour la version 4O.
Cependant, par rapport à d'autres modèles de la famille O3, l'opérateur O3 a été affiné avec des données de sécurité supplémentaires pour une utilisation par ordinateur, y compris des ensembles de données de sécurité conçus pour enseigner les limites de décision du modèle sur les confirmations et les refus.
OpenAI a publié un rapport technique montrant les performances de l'opérateur O3 sur des évaluations de sécurité spécifiques. Par rapport au modèle de l'opérateur GPT-4O, l'opérateur O3 était moins susceptible de refuser d'effectuer des activités «illicites» et de rechercher des données personnelles sensibles et moins sensible à une forme d'attaque d'IA appelée «injection rapide».
«L'opérateur O3 utilise la même approche multicouche de la sécurité que nous avons utilisée pour la version 4O de l'opérateur… Bien que l'opérateur O3 hérite des capacités de codage d'O3, il n'a pas accès natif à un environnement de codage ou à un terminal.»
La société d'IA a également révélé que le nouveau modèle basé sur l'O3 passait par des évaluations de sécurité standard, et l'opérateur a continué à être disponible en tant que prévisualisation de recherche pour les utilisateurs de ChatGpt Pro dans le monde. Cependant, ce modèle mis à niveau n'était disponible que dans l'opérateur de Chatgpt.
Knoop soupçonne que le modèle O3 d'Openai pourrait être plus coûteux que prévu
La semaine dernière, l'Arc Prize Foundation, qui maintient et administre ARC-AGI, a mis à jour ses coûts informatiques approximatifs pour O3. L'organisation estimait à l'origine que la configuration la plus performante de l'O3 a testé, O3 High, a coûté environ 3 000 $ pour résoudre un seul problème d'arc-AGI. Cependant, la fondation estime désormais que le coût pourrait être 10 fois plus élevé que précédemment estimé, peut-être environ 30 000 $ par tâche.
De plus, alors qu'Openai n'a pas encore évalué O3 ou le libérer pleinement, l'un des co-fondateurs de l'Arc Prize Foundation, Mike Knoop, estime que le prix du modèle O1-Pro est un indicateur raisonnable et une comparaison plus étroite du véritable coût de l'O3. Il a toutefois ajouté que O3 continuerait à être étiqueté comme un aperçu du classement pour refléter l'incertitude jusqu'à l'annonce des prix officiels.
Selon l'ARC Prize Foundation, un prix élevé pour O3 High ne serait pas hors de question, étant donné le montant des ressources informatiques que le modèle aurait utilisé. O3 U3 Utilisé 172x plus informatique plus que O3 Low, la configuration la plus faible de l'O3, pour lutter contre l'arc-AGI.
Des rumeurs volent depuis début mars sur les plans coûteux Openai envisageaient de présenter des clients d'entreprise . Les informations ont indiqué que la société pourrait facturer jusqu'à 20 000 $ par mois pour les «agents» d'IA spécialisés, comme les agents de développeur de logiciels.
Cependant, alors que certains ont fait valoir que même les modèles les plus chers d'Openai coûteraient bien dans le cadre de ce qu'un extracpour humain ou un membre du personnel typique, le chercheur de l'IA, Toby Ord, a souligné que les modèles peuvent ne pas être aussi efficaces. Par exemple, O3 High avait besoin de 1 024 tentatives à chaque tâche d'Arc-Agi pour obtenir son meilleur score.
Cryptopolitan Academy: Vous voulez développer votre argent en 2025? Apprenez à le faire avec DeFi dans notre prochaine webclass. Enregistrez votre place