OpenAI GPT-5 riceve recensioni contrastanti il primo giorno

- Dopo mesi di attesa, OpenAI ha lanciato GPT-5, promettendo grandi passi avanti in termini di ragionamento, codifica e velocità.
- Le prime recensioni sono contrastanti: alcuni ne elogiano le capacità, altri notano errori di matematica, ortografia e ragionamento.
- Gli utenti hanno contestato la riduzione della trasparenza e la perdita di modelli più vecchi come GPT-4o.
L'amministratore delegato di OpenAI, Sam Altman, aveva anticipato GPT-5 per mesi. Affermava che si trattasse di un modello avanzato: più intelligente, più veloce e in grado di pensare a "livello di dottorato". L'azienda ha presentato quel lancio come un importante passo avanti per ChatGPT, destinato a portare a miglioramenti dell'intelligenza nella codifica, nel ragionamento e nell'accuratezza.
Le prime reazioni, tuttavia, dipingono un quadro più confuso. Gli sviluppatori hanno elogiato il modello per la sua capacità di comprendere prompt complessi e di produrre codice ben strutturato. Simon Willison, uno dei primi tester, ha descritto GPT-5 come "competente" e "a tratti impressionante", ma non un enorme passo avanti rispetto a GPT-4. Altri, invece, sono rimasti meno colpiti.
Diversi post sui social media si sono rapidamente trasformati in lamentele su numerosi errori fattuali, scarse competenze matematiche e, in alcuni casi, persino basilari errori di ortografia. Noah Giansiracusa, professore di matematica alla Bentley University, ha definito il comunicato "deludente", osservando che gli aggiornamenti in questione sembravano "più marginali di quanto avrei sperato"
Parte della confusione era dovuta all'architettura del modello. GPT-5 includeva un "commutatore automatico" per le varie dimensioni del modello, a seconda del compito. Questo permetteva di risparmiare risorse di elaborazione e significava non dover sempre utilizzare l'intero GPT-5, cosa che ha rappresentato una falla di sicurezza per molti utenti. Dopo aver risposto in modo errato a una domanda, l'agente con cui il sistema interagiva gli ordinava di "pensare più a fondo" su quante lettere "b" ci fossero nella parola "blueberry" (mirtillo). In seguito a questo feedback, il sistema forniva la risposta corretta quando interrogato.
Gli utenti reagiscono e OpenAI risponde
La frustrazione potrebbe riversarsi su Reddit e X entro venerdì. E mentre alcuni utenti odiavano il fatto di non sapere da chi o da quale modello provenisse il testo, molti pensavano che l'inferno fosse solo un'inferenza e che GPT-5 avesse sostituito i vecchi preferiti di cui si fidavano. Alcuni hanno detto che la qualità è stata compromessa, che la scrittura non è buona come quella di GPT-4.5, cosa che voi avete concordato che dovrebbe essere, e che alcuni aspetti creativi e tecnici sono sembrati peggiori.
Questa chiacchierata ha spinto il CEO di OpenAI a partecipare a una sessione "Ask Me Anything" su Reddit per rispondere alle critiche. Ha affermato che un bug nell'autoswitcher ha fatto sì che GPT-5 funzionasse al di sotto del suo pieno potenziale fin dal primo giorno. Ha promesso di essere più trasparente nelle future transizioni di modello: "Da oggi in poi, GPT-5 dovrebbe apparire sempre più intelligente". OpenAI ha anche promesso di ridistribuire modelli precedenti come GPT-40 per coloro che avessero espresso una preferenza, nel tentativo di placare i critici più accaniti.
Il fatto che sia stato necessario agire così rapidamente evidenzia quanto fosse alta la posta in gioco. Oggi, OpenAI è in una corsa sfrenata con concorrenti come Anthropic, Google DeepMind e persino xAI di Elon Musk. Con tutta questa concorrenza, basta un piccolo passo falso e presto il tuo concorrente ti supera.
Si intensifica la competizione nella corsa all'intelligenza artificiale
Nonostante tali differenze, l'accoglienza riservata a GPT-5 fu tiepida, ma ciò non gli impedì di raggiungere la prima posizione su LMArena, una classifica basata sulle prestazioni degli utenti per l'addestramento dei modelli. Sebbene non fosse ciò che oggi considereremmo programmabile, era estremamente veloce ed espressivo, supportando query complesse e di grandi dimensioni. Tuttavia, altri benchmark mostrarono un panorama problematico diverso e più impegnativo. Grok 4 di xAI di Musk ottenne un punteggio così elevato su ARC-AGI-2 (una serie di test per il ragionamento avanzato) da rappresentare una seria minaccia al primato di OpenAI.
Alcuni analisti del settore ipotizzano che ci vorrà almeno un giorno prima che gli effetti di GPT-5 siano pienamente compresi, analogamente a quanto accaduto in passato con le innovazioni dell'azienda, come GPT-3. GPT-5 e GPT-4 hanno ricevuto forti critiche prima di vedere miglioramenti negli aggiornamenti e in altri casi d'uso. Il modello ha il potenziale per avere successo (o fallire) a seconda di quanto sia utile per il flusso di lavoro quotidiano delle persone, e ChatGPT conta quasi 700 milioni di utenti settimanali in tutto il mondo.
Per usare le parole del professore di Wharton Ethan Mollick: "Il GPT-5 fa cose, a volte sorprendenti, a volte sconcertanti, in modo completamente autonomo. È questo che lo rende così intrigante. È ancora un approccio tecnocratico, un po' inquietante, nel definire "interessanti" cose come questa parte della sfera della salute pubblica"
Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.
CORSO
- Quali criptovalute possono farti guadagnare
- Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
- Strategie di investimento poco conosciute utilizzate dai professionisti
- Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)















