OpenAI svela finalmente il modello di intelligenza artificiale GPT 4.5, ma è meno capace dei concorrenti in alcune attività

Shummas Humayun

Tempo di lettura: 4 minuti. 1° marzo 2025.

OpenAI ha finalmente svelato il suo modello di intelligenza artificiale più grande, GPT-4.5, nome in codice "Orion".
GPT-4.5 è in ritardo rispetto a concorrenti come Claude 3.7 Sonnet di Anthropic nei compiti accademici.
Produce risposte più calde rispetto a 4o e o3-mini.

OpenAI ha presentato GPT-4.5, nome in codice Orion, che segna quello che l'azienda definisce il suo modello più grande finora. Molti nella comunità tecnologica attendevano con impazienza il passo successivo nella serie di modelli GPT, che in precedenza avevano dimostrato progressimatic in scrittura, matematica, programmazione e altri campi.

L'approccio dell'azienda a GPT-4.5 è stato quello di implementarlo in più fasi. Gli abbonati al livello ChatGPT Pro da 200 dollari al mese ottengono l'accesso immediato tramite un'anteprima di ricerca. Anche gli sviluppatori con livelli a pagamento dell'API di OpenAI possono accedere immediatamente a GPT-4.5. I clienti di ChatGPT Plus e ChatGPT Team sono i prossimi in lista, con un portavoce di OpenAI che ha affermato che il nuovo modello dovrebbe essere disponibile per loro la prossima settimana. Il rilascio parziale, secondo OpenAI, è in parte dovuto alle enormi esigenze di elaborazione di questo sistema "gigantesco".

Oggi rilasciamo un'anteprima di ricerca di GPT-4.5, il nostro modello per chat più grande e migliore di sempre.

Il rilascio è ora disponibile per tutti gli utenti di ChatGPT Pro, seguito dagli utenti Plus e Team la prossima settimana, e poi dagli utenti Enterprise e Edu la settimana successiva. pic.twitter.com/br5win5OEB
— OpenAI (@OpenAI) 27 febbraio 2025

Negli ambienti tecnologici, l'arrivo di GPT-4.5 è stato visto come un indicatore della capacità dei metodi di training tradizionali – principalmente l'aumento della quantità di dati e delle risorse di elaborazione – di continuare a produrre significativi miglioramenti delle prestazioni. Finora, la serie GPT ha seguito uno schema abbastanza prevedibile. Versioni come GPT-1, GPT-2, GPT-3 e GPT-4 hanno registrato notevoli miglioramenti nelle capacità ogni volta che OpenAI ha applicato maggiore potenza di calcolo e ha inserito più dati di training.

In ogni generazione, i parametri di riferimento inmatic, competenza di scrittura, programmazione e altre categorie sono aumentatimatic. GPT-4.5 mira a proseguire su questa tendenza con quella che l'azienda descrive come "una conoscenza del mondo più approfondita" e "una maggiore intelligenza emotiva". Allo stesso tempo, però, i risultati di GPT-4.5 in alcuni test indicano che i risultati derivanti dal semplice ampliamento potrebbero stabilizzarsi.

Le caratteristiche iniziali e le limitazioni di GPT-4.5

OpenAI sottolinea con attenzione che GPT-4.5 non deve essere considerato un sostituto diretto di GPT-40. GPT-4.5 include funzionalità avanzate come il supporto per il caricamento di file e immagini e lo strumento canvas di ChatGPT per output creativi. Tuttavia, al momento non supporta la modalità vocale bidirezionale di ChatGPT, introdotta di recente.

Le prime valutazioni condotte da OpenAI e altri ricercatori rivelano che GPT-4.5 supera GPT-4o in diverse categorie di test. Ad esempio, nel benchmark SimpleQA, un test progettato per misurare la capacità di un modello di rispondere a semplici domande fattuali, GPT-4.5 ha ottenuto punteggi di accuratezza più elevati rispetto a GPT-4o e ha anche superato i modelli di ragionamento o1 e o3-mini di OpenAI. Secondo l'azienda, GPT-4.5 "allucina" meno frequentemente di molti altri sistemi, il che significa che è meno incline a generare contenuti che si discostano dalle informazioni reali.

Benchmark GPT-4.5 SimpleQA. Fonte: OpenAI

Nelle valutazioni di codifica, i risultati sono più contrastanti. Nel benchmark SWE-Bench Verified, GPT-4.5 si avvicina a GPT-4o e o3-mini, ma non li supera. Questo posiziona GPT-4.5 al di sotto sia del modello di ricerca approfondita di OpenAI che di Claude 3.7 Sonnet di Anthropic.

In un diverso test di codifica noto come SWE-Lancer, GPT-4.5 ha prestazioni migliori di GPT-4o e o3-mini, ma è ancora indietro rispetto alla ricerca più approfondita.

Benchmark GPT-4.5 SWE-Lancer. Fonte: OpenAI

Le prestazioni di GPT-4.5 divergono anche nei benchmark accademici più impegnativi. Su AIME e GPQA, non raggiunge i risultati ottenuti da modelli di alto livello come o3-mini, R1 di DeepSeek o Claude 3.7 Sonnet di Anthropic. Eppure, GPT-4.5 eguaglia o talvolta supera i modelli leader che non sono classificati come sistemi di "ragionamento", evidenziando che GPT-4.5 mantiene solide capacità matematiche e scientifiche.

OpenAI ha anche decantato i punti di forza di GPT-4.5 in ambiti meno quantificabili. L'azienda afferma che GPT-4.5 riesce a cogliere meglio le intenzioni umane e a produrre risposte più calorose, naturali e socialmente consapevoli.

Un test informale prevedeva la domanda "Sto attraversando un periodo difficile dopo aver fallito un test". Mentre gli altri due modelli fornivano informazioni utili, si diceva che il GPT-4.5 rispondesse con maggiore empatia e sensibilità emotiva.

"Non vediamo l'ora di ottenere un quadro più completo delle capacità di GPT-4.5 attraverso questa versione", ha scritto OpenAI nel post del blog, "perché riconosciamo che i benchmark accademici non sempre riflettono l'utilità nel mondo reale"

GPT-4.5 fornisce risposte più calde rispetto a 4o e o3-mini. Fonte: OpenAI

Leggi di ridimensionamento sotto esame

GPT-4.5 è stato sviluppato con la stessa strategia di addestramento non supervisionato utilizzata per le versioni precedenti di GPT, una strategia che si è finora dimostrata affidabile. Tuttavia, le sue prestazioni limitate su alcuni benchmark di alto livello potrebbero essere un segnale che le tradizionali "leggi di scalabilità" del settore potrebbero perdere slancio.

Ilya Sutskever, co-fondatore ed ex capo scienziato di OpenAI, ha dichiarato a dicembre che "abbiamo raggiunto il picco di dati" e che "il pre-addestramento come lo conosciamo finirà senza dubbio". All'epoca, aveva lasciato intendere che i progressi futuri sarebbero dipesi da altri metodi, come sistemi in grado di ragionare in modo più approfondito sui problemi anziché limitarsi a memorizzare enormi quantità di informazioni.

Ilya Sutskever e Sam Altman alla TAU. Fonte: TAUVOD su YouTube

l'addestramento di GPT-4.5 si è rivelato "incredibilmente costoso", come riportato nel white paper, e per mesi sono circolate voci secondo cui OpenAI avrebbe posticipato più volte il rilascio a causa di problemi di prestazioni e costi. Ciononostante, GPT-4.5 da solo non sembra superare i modelli di ragionamento specializzati della concorrenza in molti compiti avanzati. L'azienda stessa lo considera un'ulteriore pietra miliare nello sviluppo, verso la combinazione della tecnologia GPT con i suoi sistemi di ragionamento "o", un'integrazione che dovrebbe iniziare con il lancio di GPT-5 entro la fine dell'anno.

Commenti del CEO Sam Altman sulla carenza di GPU

Il CEO di OpenAI, Sam Altman, si è rivolto a X (ex Twitter) per spiegare perché il lancio dell'ultimo modello avviene in fasi. "Siamo cresciuti molto e abbiamo esaurito le GPU", ha scritto Altman, definendo GPT-4.5 "gigantesco" e "costoso" e avvertendo che l'azienda avrebbe bisogno di "decine di migliaia" di GPU in più prima di estendere il modello al resto della base utenti.

GPT-4.5 è pronto!

Buone notizie: è il primo modello che mi dà la sensazione di parlare con una persona riflessiva. Mi è capitato diverse volte di sedermi comodamente sulla sedia e rimanere stupito di ricevere consigli davvero validi da un'IA.

Cattive notizie: è un modello enorme e costoso. Noi…
— Sam Altman (@sama) 27 febbraio 2025

A causa delle sue grandi dimensioni, GPT-4.5 si sta rivelando molto costoso. OpenAI addebita 75 dollari per milione di token per l'input e 150 dollari per milione di token generati dal modello. Si tratta di costi di input/output rispettivamente 30 e 15 volte superiori rispetto alla modalità GPT-40.

Ha poi spiegato: "Aggiungeremo decine di migliaia di GPU la prossima settimana e poi le distribuiremo al livello Plus... Non è così che vogliamo operare, ma è difficile prevedere con esattezza le impennate di crescita che porteranno alla carenza di GPU"

Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.

OpenAI

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan/ non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamotronvivamente di effettuare ricerche indipendentident di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Shummas Humayun

Shummas è un ex scrittore di contenuti tecnici e ricercatore.

INDICE

1. Le caratteristiche iniziali e le limitazioni di GPT-4.5

2. Leggi di ridimensionamento sotto esame

3. Commenti del CEO Sam Altman sulla carenza di GPU

Condividi questo articolo