L'agente Operator di OpenAI riceve una spinta con il nuovo modello di intelligenza artificiale

- OpenAI ha aggiornato Operator, il suo agente di intelligenza artificiale che utilizza il web per eseguire attività, a un modello basato su o3, dopo aver precedentemente utilizzato una versione personalizzata di GPT-4o.
- L'operatore o3 è stato perfezionato con dati di sicurezza aggiuntivi per l'uso su computer, compresi set di dati di sicurezza progettati per insegnare i limiti decisionali del modello.
- Mike Knoop, co-fondatore dell'Arc Prize Foundation, ritiene che l'implementazione del modello o3 potrebbe risultare più costosa del previsto.
OpenAI ha aggiornato il modello di intelligenza artificiale alla base di Operator, passando dalla precedente versione personalizzata di GPT-4o a un modello basato su o3, uno degli ultimi modelli di "ragionamento" della serie o di OpenAI. L'Operator o3 è stato perfezionato con dati di sicurezza aggiuntivi per l'uso su computer e includeva set di dati di sicurezza progettati per insegnare al modello i limiti decisionali.
OpenAI ha aggiornato l'Operatore in ChatGPT con un nuovo modello di Agente che utilizza il computer (CUA) basato su una versione di OpenAI o3. Con il nuovo modello, l'Operatore è diventato più persistente e preciso nell'interazione con il browser, migliorando il tasso di successo complessivo delle attività. Fornisce inoltre risposte meglio strutturate, più chiare e complete.
Secondo OpenAI, il nuovo modello CUA ha mostratotronrispetto al settore, ottenendo il SOTA su OSWorld e WebArena. Ha anche mostratotronelevate rispetto alla versione precedente, sia nei benchmark consolidati che nelle valutazioni delle preferenze umane.
OpenAI sostituisce il modello basato su GPT-4o con una versione basata su o3
OpenAI accenna a un importante aggiornamento per ChatGPT Operator Agent pic.twitter.com/iGPQp9butD
– SabatAge (@sabatage) 22 maggio 2025
OpenAI ha sostituito l'attuale modello basato su GPT-4o per Operator con una versione basata su OpenAI o3, sebbene la versione API rimarrà basata su 4o. L'azienda di intelligenza artificiale ha inoltre affermato che Operator o3 utilizza lo stesso approccio di sicurezza multilivello utilizzato per la versione 4o.
Tuttavia, rispetto ad altri modelli della famiglia o3, l'o3 Operator è stato perfezionato con dati di sicurezza aggiuntivi per l'uso su computer, tra cui set di dati di sicurezza progettati per insegnare al modello i limiti decisionali su conferme e rifiuti.
OpenAI ha pubblicato un rapporto tecnico che mostra le prestazioni dell'operatore o3 in specifiche valutazioni di sicurezza. Rispetto al modello di operatore GPT-4o, l'operatore o3 ha mostrato una minore propensione a rifiutarsi di svolgere attività "illecite" e di cercare dati personali sensibili, oltre a essere meno vulnerabile a una forma di attacco basato sull'intelligenza artificiale nota come "iniezione di prompt".
"o3 Operator utilizza lo stesso approccio multilivello alla sicurezza che abbiamo utilizzato per la versione 4o di Operator... Sebbene o3 Operator erediti le capacità di codifica di o3, non ha accesso nativo a un ambiente di codifica o a un terminale."
L'azienda di intelligenza artificiale ha inoltre rivelato che il nuovo modello basato su o3 è stato sottoposto a valutazioni di sicurezza standard e che Operator continua a essere disponibile come anteprima di ricerca per gli utenti di ChatGPT Pro a livello globale. Tuttavia, questo modello aggiornato era disponibile solo per Operator in ChatGPT.
Knoop sospetta che l'esecuzione del modello o3 di OpenAI potrebbe essere più costosa del previsto
La scorsa settimana, l'Arc Prize Foundation, che gestisce e amministra ARC-AGI, ha aggiornato i costi di calcolo approssimativi per o3. Inizialmente, l'organizzazione aveva stimato che la configurazione di o3 più performante testata, o3 high, costasse circa 3.000 dollari per risolvere un singolo problema ARC-AGI. Tuttavia, la Fondazione ora ritiene che il costo potrebbe essere 10 volte superiore a quanto stimato in precedenza, probabilmente intorno ai 30.000 dollari per task.
Inoltre, sebbene OpenAI non abbia ancora stabilito il prezzo di o3 o non lo abbia ancora rilasciato completamente, uno dei co-fondatori dell'Arc Prize Foundation, Mike Knoop, ritiene che il prezzo del modello o1-pro sia un indicatore ragionevole e un confronto più preciso con il costo reale di o3. Ha tuttavia aggiunto che o3 continuerà a essere etichettato come anteprima nella classifica per riflettere l'incertezza fino all'annuncio del prezzo ufficiale.
Secondo l'Arc Prize Foundation, un prezzo elevato per o3 high non sarebbe da escludere, data la quantità di risorse di elaborazione che il modello presumibilmente utilizza. o3 high ha utilizzato 172 volte più risorse di elaborazione rispetto a o3 low, la configurazione di elaborazione più bassa di o3, per affrontare ARC-AGI.
circolano voci sui costosi piani tariffari che OpenAI starebbe valutando di introdurre per i clienti aziendali. Secondo le indiscrezioni, l'azienda potrebbe arrivare a chiedere fino a 20.000 dollari al mese per "agenti" di intelligenza artificiale specializzati, come ad esempio agenti per sviluppatori di software.
Tuttavia, mentre alcuni sostenevano che anche i modelli più costosi di OpenAI sarebbero costati ben al di sotto di quanto avrebbe richiesto un tipicotraco membro dello staff umano, il ricercatore di intelligenza artificiale Toby Ord ha sottolineato che i modelli potrebbero non essere altrettanto efficienti. Ad esempio, o3 high ha richiesto 1.024 tentativi per ogni attività in ARC-AGI per ottenere il punteggio migliore.
Se stai leggendo questo, sei già un passo avanti. Rimani al passo con i tempi iscrivendoti alla nostra newsletter.

Collins J. Okoth
Collins Okoth è un giornalista e analista di mercato con 8 anni di esperienza nel settore delle criptovalute e della tecnologia. È un analista finanziario certificato (CFA) e ha conseguito una laurea inmaticattuariale. In passato ha lavorato come autore e redattore per Geek Computer e CoinRabbit.
CORSO
- Quali criptovalute possono farti guadagnare
- Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
- Strategie di investimento poco conosciute utilizzate dai professionisti
- Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)














