ULTIME NOTIZIE

Secondo Stripe, l'abuso delle prove gratuite di intelligenza artificiale sta diventando un problema costoso per le startup

1 ora fa Tech
Una donna ha perso 14.000 dollari a causa di una truffa legata alle criptovalute chiamata MrBeast in Ontario

1 ora fa Notizie
Il fatturato di CoreWeave aumenta del 112% raggiungendo i 2,08 miliardi di dollari, ma le perdite più che raddoppiano

2 ore fa Attività commerciale
Il Tesoro fa pressione su Binance dopo le segnalazioni che collegano la piattaforma di scambio a flussi di criptovalute legati all'Iran

2 ore fa Notizie

SELEZIONATO PER TE

SETTIMANALE

RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

Il nuovo modello di DeepSeek supera il modello di punta nel salto di qualità dell'intelligenza artificiale

Nelius Irene

Tempo di lettura: 3 minuti. 21 agosto 2025.

DeepSeek ha rilasciato un nuovo aggiornamento V3.1 con una maggiore efficienza di pensiero.
Il nuovo aggiornamento della startup supera l'RI in diversi benchmark.
Gli analisti di mercato si aspettavano che DeepSeek lanciasse il successore di R1 all'inizio di quest'anno.

La startup cinese DeepSeek ha introdotto un nuovo aggiornamento, affermando di superare le prestazioni del rinomato R1 nei benchmark principali. In un post su WeChat di giovedì, l'azienda di intelligenza artificiale ha confermato che la nuova versione del modello, V3.1, fornisce risposte più rapide alle query e segna l'ingresso nello sviluppo di agenti di intelligenza artificiale.

DeepSeek ha aggiunto che il modello supporta un'architettura di ragionamento ibrida, con modalità sia di pensiero che di non pensiero, capacità degli agenti migliorate etronelevate nell'uso degli strumenti e nell'esecuzione delle attività.

DeepSeek fornisce un pulsante "Deep Thinking" per passare da una modalità all'altra

Finora, l'app e il sito web ufficiali di DeepSeek sono già stati aggiornati alla versione 3.1, consentendo agli utenti di passare dalla modalità di pensiero a quella non di pensiero tramite il pulsante "Deep Thinking", in modo simile a come funzionano i modelli ibridi di Anthropic come Opus e Sonnet.

Secondo quanto riferito, il modello V3.1 offre prestazioni migliori rispetto a R1 anche in benchmark come SWE e Terminal-Bench e in termini di efficienza di pensiero. Inoltre, secondo Artificial Analysis, il modello ha raggiunto 60 punti nel suo indice di intelligenza in modalità ragionamento, appena sopra i 59 ottenuti da R1. Tuttavia, l'architettura di base rimane la stessa, con 671 miliardi di parametri totali e 37 miliardi attivi.

Nonostante una maggiore efficienza, utilizza anche un numero leggermente inferiore di token rispetto a R1 in modalità di ragionamento. Il nuovo modello, tuttavia, è leggermente indietro all'ultimo modello e al modello di ragionamento open-source di OpenAI, GPT-OSS. Inoltre, manca la possibilità di chiamare funzioni in modalità di ragionamento, una limitazione considerata importante nei flussi di lavoro agentici.

La startup aveva annunciato il nuovo modello martedì, sebbene all'epoca fosse disponibile solo su Hugging Face. In una dichiarazione separata, si leggeva che la versione era stata progettata appositamente per funzionare con chip di intelligenza artificiale di nuova generazione di fabbricazione cinese.

Ora, l'azienda ha presentato un nuovo piano tariffario per la sua versione V3 aggiornata. Il piano aumenta alcuni costi, elimina gli sconti serali e riduce i costi per alcune applicazioni, a partire dal 6 settembre.

DeepSeek ha fissato il prezzo per la sua API di input a 0,07 dollari per milione di token per i cache hit e 0,56 dollari per i cache miss, con token di output a 1,68 dollari per milione. Le tariffe sono nettamente inferiori a quelle dei concorrenti: Gemini 2.5 Pro costa 10 dollari per milione di token di output (15 dollari per prompt più lunghi), GPT-5 di OpenAI costa anch'esso 10 dollari e Claude Opus 4.1 di Anthropic arriva fino a 75 dollari.

Gli analisti si aspettavano che DeepSeek rilasciasse il successore di R1 all'inizio di quest'anno

DeepSeek ha scosso per la prima volta la Silicon Valley con il lancio del suo modello di intelligenza artificiale R1, potente ed economico, a gennaio. Da allora, il modello è rimasto in prima linea nella spinta crescente della Cina verso l'intelligenza artificiale, sfidando aziende statunitensi come OpenAI.

Gli osservatori di mercato, tuttavia, sono ancora in attesa del successore di R1, un possibile modello R2, il cui lancio in molti si aspettavano all'inizio di quest'anno. Secondo alcune fonti locali, il ritardo nel lancio sarebbe dovuto all'insistenza del fondatore Liang Wenfeng nel perfezionare il modello. Allo stesso tempo, gestisce anche la sua redditizia attività di High-Flyer Asset Management.

Come già riportato da Cryptopolitan, DeepSeek ha posticipato il lancio del suo modello di intelligenza artificiale R2 a causa di persistenti problemi tecnici con i processori Ascend di Huawei. Dopo il successo del modello R1 a gennaio, DeepSeek era stata incoraggiata dalle autorità cinesi ad adottare i chip Huawei al posto dei prodotti Nvidia di fabbricazione statunitense. Tuttavia, l'azienda ha riscontrato problemi significativi durante la fase di addestramento del modello R2.

Fonti a conoscenza della questione hanno affermato che DeepSeek ha dovuto affidarsi ai chip Nvidia per l'addestramento, utilizzando i processori Ascend di Huawei solo per l'inferenza. Gli addetti ai lavori sottolineano che i chip cinesi, inclusi quelli di Huawei, sono spesso in ritardo rispetto a Nvidia in termini di connettività inter-chip, supporto software e stabilità complessiva.

Huawei ha inviato ingegneri presso gli uffici di DeepSeek per aiutarla ad adattare il modello. Tuttavia, la startup non è riuscita a completare con successo un training sull'hardware Ascend, nemmeno con l'assistenza in loco. Il lancio del modello R2, originariamente previsto per maggio, è stato posticipato a causa di queste problematiche hardware.

Mentre alcuni media cinesi ipotizzano che il nuovo modello potrebbe essere lanciato nelle prossime settimane, il fondatore di DeepSeek, Liang Wenfeng, ha espresso frustrazione interna per i suoi progressi, esortando il team a prendersi il tempo necessario per sviluppare un modello che preservi il vantaggio competitivo dell'azienda.

Nel frattempo, i pesi massimi del settore, tra cui Alibaba e Tencent, continuano a rilasciare aggiornamenti a ritmo serrato, con i modelli Qwen di Alibaba che stannotracun seguito particolarmentetron.

Le menti più brillanti del mondo delle criptovalute leggono già la nostra newsletter. Vuoi partecipare? Unisciti a loro.

DeepSeek Gemini

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Nelius Irene

Nellius è laureata in Economia Aziendale e Informatica con cinque anni di esperienza nel settore delle criptovalute. Ha inoltre conseguito la laurea presso Bitcoin Dada. Nellius ha collaborato con importanti testate giornalistiche, tra cui BanklessTimes, Cryptobasic e Riseup Media.

INDICE

1. DeepSeek fornisce un pulsante "Deep Thinking" per passare da una modalità all'altra

2. Gli analisti si aspettavano che DeepSeek rilasciasse il successore di R1 all'inizio di quest'anno

Condividi questo articolo

ALTRE NOTIZIE

MOSTRA TUTTO

5 ingegnose applicazioni di ChatGPT e cosa dovresti fare al riguardo

3 anni fa Tech John Palmer

Il 93% dei leader aziendali preferisce soluzioni basate sull'intelligenza artificiale per la gestione della sostenibilità del marchio, Reuters

3 anni fa Tech John Palmer

L'ecosistema dell'intelligenza artificiale in Francia

Ecco come Macron sostiene l'ecosistema di intelligenza artificiale francese, dinamico e produttivo

3 anni fa Tech Glory Kaburu

Bloomberg stima che il mercato dell'intelligenza artificiale generativa raggiungerà 1,3 trilioni di dollari entro il 2032

3 anni fa Tech Aamir Sheikh

Cos'è Base? La rete Ethereum Layer-2 lanciata da Coinbase

21 ottobre 2025 Impara le criptovalute: guide per principianti
Dogecoin vs. Bitcoin: differenze tecniche chiave

20 ottobre 2025 Impara le criptovalute: guide per principianti
Cos'è il TVL (valore totale bloccato) nelle criptovalute?

14 ottobre 2025 Impara le criptovalute: guide per principianti
Come leggere un whitepaper sulle criptovalute?

13 ottobre 2025 Impara le criptovalute: guide per principianti
Ripple vs. XRP vs. XRP Ledger: qual è la differenza?

13 ottobre 2025 Impara le criptovalute: guide per principianti
Cos'è un portafoglio multisig in criptovaluta?

10 ottobre 2025 Impara le criptovalute: guide per principianti

INTENSIVO CRIPTOVALUTE
CORSO

Quali criptovalute possono farti guadagnare
Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
Strategie di investimento poco conosciute utilizzate dai professionisti
Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)