OpenAI porta i suoi modelli GPT-4.1 e GPT-4.1 mini su ChatGPT

Foto di Focal Foto tramite Flickr.
- OpenAI ha rivelato ieri che renderà il modello GPT-4.1 disponibile a tutti in ChatGPT.
- Secondo le note di rilascio di OpenAI, il modello GPT-4.1 è migliore nelle attività di codifica e nel seguire le istruzioni.
- OpenAI ritirerà inoltre l'anteprima GPT-4.5 nell'API e la disattiverà tra 3 mesi per consentire agli sviluppatori di effettuare la transizione.
OpenAI ha annunciato che il suo modello di punta, GPT-4.1, verrà implementato su ChatGPT. Il modello sarà disponibile per tutti gli account a pagamento e per gli utenti dei team tramite il menu a tendina di selezione del modello. OpenAI ha rivelato che gli utenti con piano gratuito sono esclusi dall'implementazione, ma gli utenti Enterprise ed Edu potranno accedervi.
GPT-4.0 mini sarà sostituito da GPT-4.1 mini per tutti gli utenti, inclusi gli account gratuiti. Anche gli utenti con opzioni a pagamento vedranno il modello GPT-4.1 mini nel loro menu a discesa.
Secondo OpenAI, GPT-4.1 mini e GPT-4.1 sono ottimizzati per attività di codifica e offrono una risposta alle istruzioni migliorata, superando le prestazioni di GPT-4.0.
GPT-4.1 di OpenAI supera GPT-4.0 su tutta la linea
Secondo OpenAI, il modello GPT-4.1 offre una finestra di contesto più ampia, che supporta fino a un milione di token di contesto e può utilizzare meglio il contesto con una comprensione estesa. L'azienda di intelligenza artificiale ha aggiunto che gli ingegneri del software trarranno vantaggio dall'utilizzo del modello per lo sviluppo di applicazioni web.
Le note di rilascio di OpenAI hanno rivelato che gli ingegneri possono utilizzare il modello per eseguire query quotidiane, domande di approfondimento, programmazione e altre attività complesse.
L'azienda di intelligenza artificiale guidata da Sam Altman ha affermato che il modello GPT-4.1 è in grado di elaborare enormi quantità di testo, immagini e video nel prompt, rispetto al limite di 128.000 token di GPT-4.0. Secondo OpenAI, GPT-4.1 ha ottenuto un punteggio del 54,6% su SWE-bench Verified, migliorando del 21,4% rispetto a GPT-4.0 e del 26,6% rispetto a GPT-4.5, diventando così il modello leader per le attività di programmazione.
Nel benchmark MultiChallenge di Scale, un parametro di valutazione della capacità di seguire le istruzioni, GPT-4.1 ha ottenuto un punteggio del 38,3%, con un incremento del 10,5% rispetto a GPT-4.0. Inoltre, nel benchmark Video MME, un parametro di riferimento per la comprensione di contesti multimodali di lunga durata, GPT-4.1 ha ottenuto un punteggio molto elevato, pari al 72,0%, nella categoria "testi lunghi senza sottotitoli", con un miglioramento del 6,7% rispetto a GPT-4.0.
OpenAI ha rivelato che i benchmark forniscono informazioni preziose e che i modelli sono stati addestrati con particolare attenzione alle applicazioni del mondo reale. L'azienda ha espresso gratitudine alla comunità di sviluppatori per aver ottimizzato i modelli per attività complesse.
GPT-4.1 è privo di report di sicurezza
La comunità di ricerca sull'intelligenza artificiale ha criticato OpenAI per aver rilasciato il modello GPT-4.1 senza il rapporto sulla sicurezza, sostenendo che gli standard di trasparenza sui modelli di OpenAI erano stati abbassati.
L'azienda di intelligenza artificiale ha sostenuto che, nonostante offra prestazioni e velocità migliorate rispetto a GPT-4.0, il modello non richiede la segnalazione di sicurezza richiesta dai modelli più avanzati, poiché non è un modello di frontiera.
"GPT-4.1 non introduce nuove modalità o modi di interagire con il modello e non supera 03 in termini di intelligenza. Ciò significa che le considerazioni sulla sicurezza, pur essendo sostanziali, sono diverse da quelle dei modelli di frontiera."
–Johannes Heidecke, responsabile della sicurezza di Open AI
L'azienda di tecnologia di intelligenza artificiale ha rilasciato ulteriori informazioni su GPT-4.1 in risposta alle affermazioni sulla sicurezza. Mercoledì, l'azienda si è impegnata a pubblicare tempestivamente i risultati delle valutazioni interne sulla sicurezza del suo modello, nell'ambito di un'iniziativa volta ad aumentare la trasparenza.
L'azienda ha rivelato di star compiendo sforzi per distinguersi in un settore sempre più affollato. Secondo alcune indiscrezioni, la società di intelligenza artificiale sarebbe vicina ad annunciare l'acquisizione di Windsurf, uno degli strumenti di programmazione AI più noti, per 3 miliardi di dollari. Windsurf compete con Cursor, un altro popolare strumento di programmazione AI, e con le funzionalità di programmazione AI già esistenti di aziende come Microsoft e Anthropic.
Andrej Karpathy, ex fondatore di OpenAI, ha affermato che Windsurf è uno strumento a cui gli sviluppatori si sono rivolti in massa negli ultimi mesi per assemblare rapidamente il codice di nuovi software. Tra gli investitori della startup figurano Founders Fund, General Catalyst, Greenoaks e Kleiner Perkins.
Google, d'altra parte, ha aggiornato il suo chatbot Gemini per connettersi più facilmente ai progetti GitHub. L'integrazione con GitHub arriva dopo che OpenAI ha lanciato un connettore GitHub per di ChatGPT . Lo strumento del connettore GitHub effettua ricerche sul web e su altre fonti per compilare un report di ricerca approfondito su un argomento.
Martedì, OpenAI ha accolto anche i connettori SharePoint e Microsoft OneDrive nella ricerca approfondita di ChatGPT.
Se stai leggendo questo, sei già un passo avanti. Rimani al passo con i tempi iscrivendoti alla nostra newsletter.

Collins J. Okoth
Collins Okoth è un giornalista e analista di mercato con 8 anni di esperienza nel settore delle criptovalute e della tecnologia. È un analista finanziario certificato (CFA) e ha conseguito una laurea inmaticattuariale. In passato ha lavorato come autore e redattore per Geek Computer e CoinRabbit.
- Quali criptovalute possono farti guadagnare
- Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
- Strategie di investimento poco conosciute utilizzate dai professionisti
- Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)














