ULTIME NOTIZIE

vivere Bitcoin sale a 67.000 dollari grazie all'accordo di pace tra Trump e l'Iran, che spinge i mercati ai massimi storici

Aggiornamenti in diretta del 15 giugno 2026
Gli Stati Uniti si discostano dall'Europa: il Senato raggiunge un accordo sul disegno di legge che vieta le CBDC

56 minuti fa Regolamento
Le banche centrali prevedono acquisti record di oro per il 2026, mentre si acuiscono i dubbi sul dollaro e Bitcoin

1 ora fa Notizie
Binance trasforma la domanda pre-IPO di SpaceX in dominio post-IPO, grazie agli investitori al dettaglio che cercano esposizione all'offerta pubblica iniziale

1 ora fa Riflessioni sul settore

SELEZIONATO PER TE

SETTIMANALE

RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

La cinese DeepSeek lancia un modello di intelligenza artificiale di nuova generazione che rivaleggia con GPT-5. Ma sarà abbastanza valido?

Jai Hamid

Tempo di lettura: 3 minuti. 30 settembre 2025.

La cinese DeepSeek presenta un modello di intelligenza artificiale di nuova generazione, progettato per competere con il GPT-5. Ma sarà abbastanza buono?

Foto di Solen Feyissa su Unsplash.

Lunedì DeepSeek ha lanciato il suo nuovo modello V3.2-Exp, focalizzato sulla velocità, sulla riduzione dei costi e sulla gestione di grandi quantità di dati.
Il modello introduce DeepSeek Sparse Attention, che ignora i dati irrilevanti per migliorare l'efficienza e dimezzare i costi.
Gli esperti avvertono che una scarsa attenzione potrebbe far perdere informazioni importanti e ridurne l'affidabilità, nonostante i benefici.

Il giovane talento tecnologico cinese DeepSeek ha lanciato un nuovo modello sperimentale, V3.2-Exp, nell'ambito del suo tentativo di sfidare il predominio americano nell'intelligenza artificiale. Il lancio è avvenuto lunedì ed è stato reso pubblico per la prima volta tramite un post su Hugging Face, un popolare forum dedicato all'intelligenza artificiale.

DeepSeek sostiene che questa ultima versione si basa sul modello attuale, V3.1-Terminus, ma contronenfasi su velocità, costi e gestione della memoria.

Secondo Adina Yakefu, responsabile della community cinese di Hugging Face, il modello è dotato di una funzionalità chiamata DeepSeek Sparse Attention, o DSA, che, secondo lei, "rende l'intelligenza artificiale più efficace nella gestione di documenti e conversazioni lunghi", riducendo al contempo della metà i costi operativi.

Come ricorderete ,circa un anno fa DeepSeek ha sconvolto il mondo del web rilasciando a sorpresa il suo primo modello, R1. Quel modello aveva dimostrato la possibilità di addestrare un modello linguistico di grandi dimensioni utilizzando un numero inferiore di chip e una potenza di calcolo decisamente inferiore. Nessuno si aspettava che un team cinese riuscisse in un'impresa del genere con tali limitazioni. Con la versione 3.2-Exp, l'obiettivo non è cambiato: meno hardware, più prestazioni.

Aggiunge DeepSeek Sparse Attention e riduce i costi di esecuzione dell'IA

La caratteristica principale di questo modello è la DSA (Deep Seek Analysis). Modifica il modo in cui l'IA seleziona le informazioni da analizzare. Invece di scansionare tutto, DeepSeek addestra il modello a concentrarsi solo su ciò che sembra utile per il compito. Adina ha spiegato che il vantaggio è duplice: "efficienza" e "riduzione dei costi".

Saltando i dati irrilevanti, il modello si muove più velocemente e richiede meno energia. Ha affermato che il modello è stato progettato pensando alla collaborazione open source.

Nick Patience, a capo della ricerca sull'intelligenza artificiale presso The Futurum Group, ha dichiarato alla CNBC che il modello ha il potenziale per offrire potenti strumenti di intelligenza artificiale agli sviluppatori che non possono permettersi modelli più costosi. "Dovrebbe rendere il modello più veloce ed economico da utilizzare, senza un calo significativo delle prestazioni", ha affermato Nick. Ma questo non significa che non ci siano rischi.

Il modo in cui DeepSeek utilizza l'attenzione sparsa è simile a come le compagnie aeree scelgono le rotte di volo. Potrebbero esserci centinaia di modi per andare da un luogo all'altro, ma solo pochi hanno senso. Il modello filtra il rumore e si concentra su ciò che conta, o almeno su ciò che ritiene importante.

Ma questo comporta delle preoccupazioni. Ekaterina Almasque, cofondatrice di BlankPage Capital, lo ha spiegato in modo semplice: "In pratica, si eliminano le cose che si ritengono non importanti". Il problema, però, ha aggiunto, è che non c'è alcuna garanzia che il modello elimini le giuste .

Ekaterina, che ha sostenuto aziende come Dataiku, Darktrace Graphcore, ha avvertito che prendere scorciatoie potrebbe creare problemi in seguito. "Questi [modelli di attenzione sparsi] hanno perso molte sfumature", ha affermato. "E allora la vera domanda è: avevano il meccanismo giusto per escludere i dati non importanti, oppure esiste un meccanismo che esclude i dati davvero importanti, e quindi il risultato sarà molto meno rilevante?"

Si collega ai chip cinesi e rilascia codice aperto

Nonostante queste preoccupazioni, DeepSeek insiste sul fatto che la versione 3.2-Exp offre prestazioni pari a quelle della versione 3.1-Terminus. Il modello può inoltre funzionare direttamente su chip cinesi come Ascend e Cambricon, senza bisogno di configurazioni aggiuntive. Questo è fondamentale nel più ampio sforzo della Cina di sviluppare l'intelligenza artificiale su hardware nazionale e ridurre la dipendenza dalla tecnologia straniera. "DeepSeek funziona con questi chip fin da subito", ha affermato Adina.

L'azienda ha anche reso pubblici il codice completo e gli strumenti del modello. Ciò significa che chiunque può scaricare, eseguire, modificare o sviluppare sulla base della V3.2-Exp. Questa mossa è in linea con la strategia open source di DeepSeek, ma solleva un'altra questione: i brevetti. Poiché il modello è aperto e l'idea di base, scarsamente nota, esiste dal 2015, DeepSeek non può garantirne la protezione legale.

"L'approccio non è poi così nuovo", ha affermato Ekaterina. Per lei, l'unica parte difendibile della tecnologia è il modo in cui DeepSeek sceglie cosa mantenere e cosa ignorare.

È qui che ora risiede la vera competizione. Non solo nel realizzare modelli più intelligenti, ma nel renderli più veloci, economici e snelli, senza compromettere i risultati. Persino DeepSeek ha definito questa versione "un passo intermedio verso la nostra architettura di prossima generazione", il che suggerisce che stanno già lavorando a qualcosa di più grande.

Nick ha affermato che il modello dimostra che l'efficienza è ora importante tanto quanto la potenza pura. E Adina ritiene che l'azienda abbia in mente una strategia a lungo termine. "DeepSeek sta giocando a lungo termine per mantenere la comunità coinvolta nel loro progresso", ha affermato. "Le persone sceglieranno sempre ciò che è economico, affidabile ed efficace"

Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.

Cambricon DeepSeek Huawei

Condividi questo articolo

Jai Hamid

Jai Hamid si occupa di criptovalute, mercati azionari, tecnologia, economia globale ed eventi geopolitici che influenzano i mercati da sei anni. Ha collaborato con pubblicazioni specializzate in blockchain, tra cui AMB Crypto, Coin Edition e CryptoTale, realizzando analisi di mercato, reportage su importanti aziende, normative e tendenze macroeconomiche. Ha frequentato la London School of Journalism e ha condiviso per tre volte le sue analisi sul mercato delle criptovalute su una delle principali emittenti televisive africane.

INDICE

1. Aggiunge DeepSeek Sparse Attention e riduce i costi di esecuzione dell'IA

2. Si collega ai chip cinesi e rilascia codice aperto

Condividi questo articolo

ALTRE NOTIZIE

MOSTRA TUTTO

5 ingegnose applicazioni di ChatGPT e cosa dovresti fare al riguardo

3 anni fa Tech John Palmer

Il 93% dei leader aziendali preferisce soluzioni basate sull'intelligenza artificiale per la gestione della sostenibilità del marchio, Reuters

3 anni fa Tech John Palmer

L'ecosistema dell'intelligenza artificiale in Francia

Ecco come Macron sostiene l'ecosistema di intelligenza artificiale francese, dinamico e produttivo

3 anni fa Tech Glory Kaburu

Bloomberg stima che il mercato dell'intelligenza artificiale generativa raggiungerà 1,3 trilioni di dollari entro il 2032

3 anni fa Tech Aamir Sheikh

Cos'è Base? La rete Ethereum Layer-2 lanciata da Coinbase

21 ottobre 2025 Impara le criptovalute: guide per principianti
Dogecoin vs. Bitcoin: differenze tecniche chiave

20 ottobre 2025 Impara le criptovalute: guide per principianti
Cos'è il TVL (valore totale bloccato) nelle criptovalute?

14 ottobre 2025 Impara le criptovalute: guide per principianti
Come leggere un whitepaper sulle criptovalute?

13 ottobre 2025 Impara le criptovalute: guide per principianti
Ripple vs. XRP vs. XRP Ledger: qual è la differenza?

13 ottobre 2025 Impara le criptovalute: guide per principianti
Cos'è un portafoglio multisig in criptovaluta?

10 ottobre 2025 Impara le criptovalute: guide per principianti

CORSO INTENSIVO DI CRIPTOVALUTE

Quali criptovalute possono farti guadagnare
Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
Strategie di investimento poco conosciute utilizzate dai professionisti
Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)