Openai ha svelato GPT-4.5, con nome Orion in codice, segnando ciò che la società chiama il suo modello più grande finora. Molti nella comunità tecnologica hanno atteso con impazienza il passo successivo nella serie di modelli GPT, che hanno precedentemente dimostrato i salti di Dramatic in scrittura, matematica, programmazione e altri campi.
L'approccio dell'azienda a GPT-4.5 è stato quello di lanciarlo in fasi. Gli abbonati al GHATGPT Pro Tier ottengono un accesso immediato con un'anteprima di ricerca. Gli sviluppatori su livelli a pagamento dell'API di Openi possono anche accedere immediatamente a GPT-4.5. I clienti del team di Chatgpt Plus e Chatgpt sono i prossimi in linea, con un portavoce di Openai che afferma che il nuovo modello dovrebbe diventare disponibile per loro la prossima settimana. Il rilascio in parte, secondo Openi, è in parte dovuto alle enormi richieste di calcolo alla base di questo sistema "gigante".
Oggi stiamo rilasciando un'anteprima di ricerca di GPT-4.5, il nostro modello più grande e migliore per la chat.
—OpenAI (@OpenAI) 27 febbraio 2025
Rileggendo ora a tutti gli utenti di Chatgpt Pro, seguiti dagli utenti di Plus e Team la prossima settimana, quindi agli utenti Enterprise ed EDU la settimana successiva. pic.twitter.com/br5win5oeb
Tra i circoli tecnologici, l'arrivo di GPT-4.5 è stato visto come un indicatore del fatto che i metodi di allenamento tradizionali-che aumentano la quantità di dati e le risorse di calcolo-continuerà a produrre importanti guadagni di prestazioni. Fino ad ora, la serie GPT ha seguito uno schema abbastanza prevedibile. Versioni come GPT-1, GPT-2, GPT-3 e GPT-4 hanno visto notevoli salti in capacità ogni volta che Openi ha applicato più potenza di calcolo e alimentato in più dati di formazione.
In ogni generazione, i parametri di riferimento tramite Mathematic, la competenza di scrittura, la codifica e altre categorie hanno scalato DramaticAlly. GPT-4.5 mira a continuare questa tendenza con quella che l'azienda descrive come "una conoscenza del mondo più profonda" e "intelligenza emotiva superiore". Ma allo stesso tempo, i risultati di GPT-4.5 su alcuni test indicano che i rendimenti dal semplice ridimensionamento potrebbero essere livellati.
Le caratteristiche iniziali e i limiti di GPT-4.5
Openi è attento a sottolineare che GPT-4.5 non dovrebbe essere visto come un sostituto diretto per GPT-4O. GPT-4.5 include funzionalità avanzate come il supporto per i caricamenti di file e le immagini e lo strumento di tela di CHATGPT per output creativi. Tuttavia, attualmente non supporta la modalità vocale a due vie recentemente introdotta da CHATGPT.
Le valutazioni precoci gestite da OpenAI e altri ricercatori rivelano che GPT-4.5 supera GPT-4O in diverse categorie di test. Ad esempio, sul benchmark Simpleqa: un test progettato per misurare il modo in cui un modello può rispondere a domande fattuali semplici: GPT-4.5 ha registrato punteggi di precisione più alti rispetto a GPT-4O e ha anche sovraperformato i modelli di ragionamento O1 e O3-Mini di Openi. Secondo la società, GPT-4.5 "allucina" meno frequentemente di molti altri sistemi, il che significa che è meno soggetto a generare contenuti che diverge da informazioni reali.
Nelle valutazioni di codifica, i risultati sono più miscelati. Sul punto di riferimento verificato con panca SWE, GPT-4.5 corrisponde all'incirca GPT-4O e O3-Mini ma non li supera. Questo colloca GPT-4.5 sotto sia il modello di ricerca profonda di Openi che il sonetto Claude 3.7 di Antropic.
In un diverso test di codifica noto come SWE-Lancer, GPT-4.5 funziona meglio di GPT-4O e O3-Mini ma è ancora in ritardo rispetto a una ricerca profonda.
La performance di GPT-4.5 si differenzia anche su impegni accademici impegnativi. Su AIME e GPQA, non ottiene i risultati visti da modelli di alto livello come O3-Mini, R1 di DeepSeek o sonetto Claude 3.7 di Antropic. Eppure le partite GPT-4.5 o talvolta batte i principali modelli che non sono classificati come sistemi di "ragionamento", evidenziando che GPT-4.5 mantiene solide capacità di matematica e scienze.
Openi ha anche propagandato i punti di forza di GPT-4.5 in aree meno quantificabili. La società afferma che GPT-4.5 può cogliere meglio le intenzioni umane e produrre risposte che sembrano più calde, più naturali e più socialmente consapevoli.
Un test informale ha comportato il prompt, "Sto attraversando un momento difficile dopo aver fallito un test". Mentre gli altri due modelli offrivano informazioni utili, si diceva che GPT-4.5 rispondesse con maggiore empatia e sensibilità emotiva.
"[Non vedo l'ora di ottenere un quadro più completo delle capacità di GPT-4.5 attraverso questa versione", ha scritto Openai nel post del blog, "perché riconosciamo i benchmark accademici non riflettono sempre l'utilità del mondo reale."
Leggi di ridimensionamento sotto controllo
GPT-4.5 è stato costruito con la stessa strategia di formazione non supervisionata utilizzata per le versioni GPT precedenti, una strategia che finora si è dimostrata affidabile. Tuttavia, le sue prestazioni limitate su determinati parametri di alto livello potrebbero essere un segno che le tradizionali "leggi di ridimensionamento" del settore potrebbero essere perdite.
Ilya Sutskever, co-fondatrice ed ex capo scienziato di Openi, ha osservato a dicembre che "abbiamo raggiunto i dati di picco" e che "il pre-allenamento come sappiamo che finirà senza dubbio". All'epoca, ha lasciato intendere che i guadagni futuri dipendevano da altri metodi, come i sistemi che possono ragionare più profondamente sui problemi piuttosto che semplicemente memorizzare enormi aree di informazione.
GPT-4.5 era apparentemente "incredibilmente costoso da allenarsi", come menzionato nel suo libro bianco e le voci facevano circolare per mesi che Openai aveva ritardato il rilascio più volte a causa delle prestazioni e degli ostacoli. Anche così, il solo GPT-4.5 non sembra superare i modelli di ragionamento specializzati dai concorrenti su molti compiti avanzati. La stessa società lo considera un altro traguardo di sviluppo sulla strada per combinare la tecnologia GPT con i suoi sistemi di ragionamento "O", un'integrazione che dovrebbe iniziare con il lancio di GPT-5 entro la fine dell'anno.
Commenti dal CEO Sam Altman sulla carenza di GPU
Il CEO di Openi Sam Altman ha preso X (precedentemente Twitter) per spiegare perché l'implementazione dell'ultimo modello sta avvenendo in fasi. "Siamo cresciuti molto e siamo fuori dalle GPU", ha scritto Altman, chiamando GPT-4.5 "Giant" e "costoso" e avvertendo che la società avrebbe bisogno di "decine di migliaia" in più di GPU prima di aprire il modello al resto della base di utenti.
GPT-4.5 è pronto!
— Sam Altman (@sama) 27 febbraio 2025
Buone notizie: è il primo modello che mi sembra di parlare con una persona ponderata per me. Ho avuto diversi momenti in cui mi sono seduto sulla mia sedia ed sono stato stupito di ricevere davvero buoni consigli da un AI.
Cattive notizie: è un modello gigante e costoso. Noi…
Per le sue grandi dimensioni, GPT-4.5 si sta dimostrando molto costoso. Openi addebita $ 75 per milione di token per l'input e $ 150 per milione di token generati dal modello. Questo è 30x e 15x il costo di input/output rispetto alla modalità GPT-4O.
Ha elaborato ulteriormente: "Aggiungeremo decine di migliaia di GPU la prossima settimana e lo lanciamo fino al livello più allora ... non è così che vogliamo operare, ma è difficile prevedere perfettamente le estensioni di crescita che portano a carenze di GPU".
Cryptolitan Academy: stanco delle oscillazioni del mercato? Scopri come DeFi può aiutarti a costruire un reddito passivo costante. Registrati ora