ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

La cinese DeepSeek lancia un modello di intelligenza artificiale di nuova generazione che rivaleggia con GPT-5. Ma sarà abbastanza valido?

DiJai HamidJai Hamid
Tempo di lettura: 3 minuti.
La cinese DeepSeek presenta un modello di intelligenza artificiale di nuova generazione, progettato per competere con il GPT-5. Ma sarà abbastanza buono?
  • Lunedì DeepSeek ha lanciato il suo nuovo modello V3.2-Exp, focalizzato sulla velocità, sulla riduzione dei costi e sulla gestione di grandi quantità di dati.
  • Il modello introduce DeepSeek Sparse Attention, che ignora i dati irrilevanti per migliorare l'efficienza e dimezzare i costi.
  • Gli esperti avvertono che una scarsa attenzione potrebbe far perdere informazioni importanti e ridurne l'affidabilità, nonostante i benefici.

Il giovane talento tecnologico cinese DeepSeek ha lanciato un nuovo modello sperimentale, V3.2-Exp, nell'ambito del suo tentativo di sfidare il predominio americano nell'intelligenza artificiale. Il lancio è avvenuto lunedì ed è stato reso pubblico per la prima volta tramite un post su Hugging Face, un popolare forum dedicato all'intelligenza artificiale.

DeepSeek sostiene che questa ultima versione si basa sul modello attuale, V3.1-Terminus, ma contronenfasi su velocità, costi e gestione della memoria.

Secondo Adina Yakefu, responsabile della community cinese di Hugging Face, il modello è dotato di una funzionalità chiamata DeepSeek Sparse Attention, o DSA, che, secondo lei, "rende l'intelligenza artificiale più efficace nella gestione di documenti e conversazioni lunghi", riducendo al contempo della metà i costi operativi.

Come ricorderete ,circa un anno fa DeepSeek ha sconvolto il mondo del web rilasciando a sorpresa il suo primo modello, R1. Quel modello aveva dimostrato la possibilità di addestrare un modello linguistico di grandi dimensioni utilizzando un numero inferiore di chip e una potenza di calcolo decisamente inferiore. Nessuno si aspettava che un team cinese riuscisse in un'impresa del genere con tali limitazioni. Con la versione 3.2-Exp, l'obiettivo non è cambiato: meno hardware, più prestazioni.

Aggiunge DeepSeek Sparse Attention e riduce i costi di esecuzione dell'IA

La caratteristica principale di questo modello è la DSA (Deep Seek Analysis). Modifica il modo in cui l'IA seleziona le informazioni da analizzare. Invece di scansionare tutto, DeepSeek addestra il modello a concentrarsi solo su ciò che sembra utile per il compito. Adina ha spiegato che il vantaggio è duplice: "efficienza" e "riduzione dei costi".

Saltando i dati irrilevanti, il modello si muove più velocemente e richiede meno energia. Ha affermato che il modello è stato progettato pensando alla collaborazione open source.

Nick Patience, a capo della ricerca sull'intelligenza artificiale presso The Futurum Group, ha dichiarato alla CNBC che il modello ha il potenziale per offrire potenti strumenti di intelligenza artificiale agli sviluppatori che non possono permettersi modelli più costosi. "Dovrebbe rendere il modello più veloce ed economico da utilizzare, senza un calo significativo delle prestazioni", ha affermato Nick. Ma questo non significa che non ci siano rischi.

Il modo in cui DeepSeek utilizza l'attenzione sparsa è simile a come le compagnie aeree scelgono le rotte di volo. Potrebbero esserci centinaia di modi per andare da un luogo all'altro, ma solo pochi hanno senso. Il modello filtra il rumore e si concentra su ciò che conta, o almeno su ciò che ritiene importante.

Ma questo comporta delle preoccupazioni. Ekaterina Almasque, cofondatrice di BlankPage Capital, lo ha spiegato in modo semplice: "In pratica, si eliminano le cose che si ritengono non importanti". Il problema, però, ha aggiunto, è che non c'è alcuna garanzia che il modello elimini le giuste .

Ekaterina, che ha sostenuto aziende come Dataiku, Darktrace Graphcore, ha avvertito che prendere scorciatoie potrebbe creare problemi in seguito. "Questi [modelli di attenzione sparsi] hanno perso molte sfumature", ha affermato. "E allora la vera domanda è: avevano il meccanismo giusto per escludere i dati non importanti, oppure esiste un meccanismo che esclude i dati davvero importanti, e quindi il risultato sarà molto meno rilevante?"

Si collega ai chip cinesi e rilascia codice aperto

Nonostante queste preoccupazioni, DeepSeek insiste sul fatto che la versione 3.2-Exp offre prestazioni pari a quelle della versione 3.1-Terminus. Il modello può inoltre funzionare direttamente su chip cinesi come Ascend e Cambricon, senza bisogno di configurazioni aggiuntive. Questo è fondamentale nel più ampio sforzo della Cina di sviluppare l'intelligenza artificiale su hardware nazionale e ridurre la dipendenza dalla tecnologia straniera. "DeepSeek funziona con questi chip fin da subito", ha affermato Adina.

L'azienda ha anche reso pubblici il codice completo e gli strumenti del modello. Ciò significa che chiunque può scaricare, eseguire, modificare o sviluppare sulla base della V3.2-Exp. Questa mossa è in linea con la strategia open source di DeepSeek, ma solleva un'altra questione: i brevetti. Poiché il modello è aperto e l'idea di base, scarsamente nota, esiste dal 2015, DeepSeek non può garantirne la protezione legale.

"L'approccio non è poi così nuovo", ha affermato Ekaterina. Per lei, l'unica parte difendibile della tecnologia è il modo in cui DeepSeek sceglie cosa mantenere e cosa ignorare.

È qui che ora risiede la vera competizione. Non solo nel realizzare modelli più intelligenti, ma nel renderli più veloci, economici e snelli, senza compromettere i risultati. Persino DeepSeek ha definito questa versione "un passo intermedio verso la nostra architettura di prossima generazione", il che suggerisce che stanno già lavorando a qualcosa di più grande.

Nick ha affermato che il modello dimostra che l'efficienza è ora importante tanto quanto la potenza pura. E Adina ritiene che l'azienda abbia in mente una strategia a lungo termine. "DeepSeek sta giocando a lungo termine per mantenere la comunità coinvolta nel loro progresso", ha affermato. "Le persone sceglieranno sempre ciò che è economico, affidabile ed efficace"

Se stai leggendo questo, sei già un passo avanti. Rimani al passo con i tempi iscrivendoti alla nostra newsletter.

Condividi questo articolo
ALTRE NOTIZIE
INTENSIVO CRIPTOVALUTE
CORSO