COMING SOON: A New Way to Earn Passive Income with DeFi in 2025 LEARN MORE

Openi rivela finalmente il modello AI GPT 4.5 ma è meno capace dei concorrenti in alcune attività

In questo post:

  • Openai ha finalmente presentato il suo più grande modello di intelligenza artificiale, GPT-4.5 in codice "Orion".
  • GPT-4.5 in ritardo rispetto ai concorrenti come il sonet Claude 3.7 di Antropic in compiti accademici.
  • Produce risposte più calde rispetto a 4O e O3-Mini.

Openai ha svelato GPT-4.5, con nome Orion in codice, segnando ciò che la società chiama il suo modello più grande finora. Molti nella comunità tecnologica hanno atteso con impazienza il passo successivo nella serie di modelli GPT, che hanno precedentemente dimostrato i salti di Dramatic in scrittura, matematica, programmazione e altri campi. 

L'approccio dell'azienda a GPT-4.5 è stato quello di lanciarlo in fasi. Gli abbonati al GHATGPT Pro Tier ottengono un accesso immediato con un'anteprima di ricerca. Gli sviluppatori su livelli a pagamento dell'API di Openi possono anche accedere immediatamente a GPT-4.5. I clienti del team di Chatgpt Plus e Chatgpt sono i prossimi in linea, con un portavoce di Openai che afferma che il nuovo modello dovrebbe diventare disponibile per loro la prossima settimana. Il rilascio in parte, secondo Openi, è in parte dovuto alle enormi richieste di calcolo alla base di questo sistema "gigante".

Tra i circoli tecnologici, l'arrivo di GPT-4.5 è stato visto come un indicatore del fatto che i metodi di allenamento tradizionali-che aumentano la quantità di dati e le risorse di calcolo-continuerà a produrre importanti guadagni di prestazioni. Fino ad ora, la serie GPT ha seguito uno schema abbastanza prevedibile. Versioni come GPT-1, GPT-2, GPT-3 e GPT-4 hanno visto notevoli salti in capacità ogni volta che Openi ha applicato più potenza di calcolo e alimentato in più dati di formazione.

In ogni generazione, i parametri di riferimento tramite Mathematic, la competenza di scrittura, la codifica e altre categorie hanno scalato DramaticAlly. GPT-4.5 mira a continuare questa tendenza con quella che l'azienda descrive come "una conoscenza del mondo più profonda" e "intelligenza emotiva superiore". Ma allo stesso tempo, i risultati di GPT-4.5 su alcuni test indicano che i rendimenti dal semplice ridimensionamento potrebbero essere livellati.

Le caratteristiche iniziali e i limiti di GPT-4.5

Openi è attento a sottolineare che GPT-4.5 non dovrebbe essere visto come un sostituto diretto per GPT-4O. GPT-4.5 include funzionalità avanzate come il supporto per i caricamenti di file e le immagini e lo strumento di tela di CHATGPT per output creativi. Tuttavia, attualmente non supporta la modalità vocale a due vie recentemente introdotta da CHATGPT.

Vedi anche  Ex Openi Employes File Support per Musk's Restructure Goint

Le valutazioni precoci gestite da OpenAI e altri ricercatori rivelano che GPT-4.5 supera GPT-4O in diverse categorie di test. Ad esempio, sul benchmark Simpleqa: un test progettato per misurare il modo in cui un modello può rispondere a domande fattuali semplici: GPT-4.5 ha registrato punteggi di precisione più alti rispetto a GPT-4O e ha anche sovraperformato i modelli di ragionamento O1 e O3-Mini di Openi. Secondo la società, GPT-4.5 "allucina" meno frequentemente di molti altri sistemi, il che significa che è meno soggetto a generare contenuti che diverge da informazioni reali.

Benchmark GPT-4.5 Simpleqa. Fonte: Openi

Nelle valutazioni di codifica, i risultati sono più miscelati. Sul punto di riferimento verificato con panca SWE, GPT-4.5 corrisponde all'incirca GPT-4O e O3-Mini ma non li supera. Questo colloca GPT-4.5 sotto sia il modello di ricerca profonda di Openi che il sonetto Claude 3.7 di Antropic. 

Benchmark SWE GPT-4.5. Fonte: Openi

In un diverso test di codifica noto come SWE-Lancer, GPT-4.5 funziona meglio di GPT-4O e O3-Mini ma è ancora in ritardo rispetto a una ricerca profonda.

Benchmark GPT-4.5 SWE-Lancer. Fonte: Openi

La performance di GPT-4.5 si differenzia anche su impegni accademici impegnativi. Su AIME e GPQA, non ottiene i risultati visti da modelli di alto livello come O3-Mini, R1 di DeepSeek o sonetto Claude 3.7 di Antropic. Eppure le partite GPT-4.5 o talvolta batte i principali modelli che non sono classificati come sistemi di "ragionamento", evidenziando che GPT-4.5 mantiene solide capacità di matematica e scienze.

Openi ha anche propagandato i punti di forza di GPT-4.5 in aree meno quantificabili. La società afferma che GPT-4.5 può cogliere meglio le intenzioni umane e produrre risposte che sembrano più calde, più naturali e più socialmente consapevoli. 

Un test informale ha comportato il prompt, "Sto attraversando un momento difficile dopo aver fallito un test". Mentre gli altri due modelli offrivano informazioni utili, si diceva che GPT-4.5 rispondesse con maggiore empatia e sensibilità emotiva.

"[Non vedo l'ora di ottenere un quadro più completo delle capacità di GPT-4.5 attraverso questa versione", ha scritto Openai nel post del blog, "perché riconosciamo i benchmark accademici non riflettono sempre l'utilità del mondo reale."

GPT-4.5 fornisce risposte più calde rispetto a 4O e O3-Mini. Fonte: Openi

Leggi di ridimensionamento sotto controllo

GPT-4.5 è stato costruito con la stessa strategia di formazione non supervisionata utilizzata per le versioni GPT precedenti, una strategia che finora si è dimostrata affidabile. Tuttavia, le sue prestazioni limitate su determinati parametri di alto livello potrebbero essere un segno che le tradizionali "leggi di ridimensionamento" del settore potrebbero essere perdite.

Ilya Sutskever, co-fondatrice ed ex capo scienziato di Openi, ha osservato a dicembre che "abbiamo raggiunto i dati di picco" e che "il pre-allenamento come sappiamo che finirà senza dubbio". All'epoca, ha lasciato intendere che i guadagni futuri dipendevano da altri metodi, come i sistemi che possono ragionare più profondamente sui problemi piuttosto che semplicemente memorizzare enormi aree di informazione. 

Vedi anche  Google taglia centinaia di posti di lavoro in team Android, Pixel e Chrome
Ilya Sutskever e Sam Altman a Tau. Fonte: Tauvod su YouTube

GPT-4.5 era apparentemente "incredibilmente costoso da allenarsi", come menzionato nel suo libro bianco e le voci facevano circolare per mesi che Openai aveva ritardato il rilascio più volte a causa delle prestazioni e degli ostacoli. Anche così, il solo GPT-4.5 non sembra superare i modelli di ragionamento specializzati dai concorrenti su molti compiti avanzati. La stessa società lo considera un altro traguardo di sviluppo sulla strada per combinare la tecnologia GPT con i suoi sistemi di ragionamento "O", un'integrazione che dovrebbe iniziare con il lancio di GPT-5 entro la fine dell'anno.

Commenti dal CEO Sam Altman sulla carenza di GPU

Il CEO di Openi Sam Altman ha preso X (precedentemente Twitter) per spiegare perché l'implementazione dell'ultimo modello sta avvenendo in fasi. "Siamo cresciuti molto e siamo fuori dalle GPU", ha scritto Altman, chiamando GPT-4.5 "Giant" e "costoso" e avvertendo che la società avrebbe bisogno di "decine di migliaia" in più di GPU prima di aprire il modello al resto della base di utenti.

Per le sue grandi dimensioni, GPT-4.5 si sta dimostrando molto costoso. Openi addebita $ 75 per milione di token per l'input e $ 150 per milione di token generati dal modello. Questo è 30x e 15x il costo di input/output rispetto alla modalità GPT-4O.

Ha elaborato ulteriormente: "Aggiungeremo decine di migliaia di GPU la prossima settimana e lo lanciamo fino al livello più allora ... non è così che vogliamo operare, ma è difficile prevedere perfettamente le estensioni di crescita che portano a carenze di GPU".

Cryptolitan Academy: stanco delle oscillazioni del mercato? Scopri come DeFi può aiutarti a costruire un reddito passivo costante. Registrati ora

Condividi il link:

Disclaimer. Le informazioni fornite non costituiscono consigli di trading. Cryptopolitan.com non si assume alcuna responsabilità per eventuali investimenti effettuati sulla base delle informazioni fornite in questa pagina. Raccomandiamo tron dent e/o la consultazione di un professionista qualificato prima di prendere qualsiasi decisione di investimento .

I più letti

Caricamento degli articoli più letti...

Rimani aggiornato sulle notizie crittografiche, ricevi aggiornamenti quotidiani nella tua casella di posta

La scelta dell'editore

Caricamento articoli scelti dall'editore...

- La newsletter Crypto che ti tiene avanti -

I mercati si muovono velocemente.

Ci muoviamo più velocemente.

Iscriviti al Cryptolitan Daily e diventa intuizioni cripto tempestive, nitide e pertinenti direttamente alla tua casella di posta.

Unisciti ora e
non perdere mai una mossa.

Entra. Ottieni i fatti.
Andare avanti.

Iscriviti a CryptoPolitan