Il nuovo modello di DeepSeek supera il modello di punta nel salto di qualità dell'intelligenza artificiale

- DeepSeek ha rilasciato un nuovo aggiornamento V3.1 con una maggiore efficienza di pensiero.
- Il nuovo aggiornamento della startup supera l'RI in diversi benchmark.
- Gli analisti di mercato si aspettavano che DeepSeek lanciasse il successore di R1 all'inizio di quest'anno.
La startup cinese DeepSeek ha introdotto un nuovo aggiornamento, affermando di superare le prestazioni del rinomato R1 nei benchmark principali. In un post su WeChat di giovedì, l'azienda di intelligenza artificiale ha confermato che la nuova versione del modello, V3.1, fornisce risposte più rapide alle query e segna l'ingresso nello sviluppo di agenti di intelligenza artificiale.
DeepSeek ha aggiunto che il modello supporta un'architettura di ragionamento ibrida, con modalità sia di pensiero che di non pensiero, capacità degli agenti migliorate etronelevate nell'uso degli strumenti e nell'esecuzione delle attività.
DeepSeek fornisce un pulsante "Deep Thinking" per passare da una modalità all'altra
Finora, l'app e il sito web ufficiali di DeepSeek sono già stati aggiornati alla versione 3.1, consentendo agli utenti di passare dalla modalità di pensiero a quella non di pensiero tramite il pulsante "Deep Thinking", in modo simile a come funzionano i modelli ibridi di Anthropic come Opus e Sonnet.
Secondo quanto riferito, il modello V3.1 offre prestazioni migliori rispetto a R1 anche in benchmark come SWE e Terminal-Bench e in termini di efficienza di pensiero. Inoltre, secondo Artificial Analysis, il modello ha raggiunto 60 punti nel suo indice di intelligenza in modalità ragionamento, appena sopra i 59 ottenuti da R1. Tuttavia, l'architettura di base rimane la stessa, con 671 miliardi di parametri totali e 37 miliardi attivi.
Nonostante una maggiore efficienza, utilizza anche un numero leggermente inferiore di token rispetto a R1 in modalità di ragionamento. Il nuovo modello, tuttavia, è leggermente indietro all'ultimo modello e al modello di ragionamento open-source di OpenAI, GPT-OSS. Inoltre, manca la possibilità di chiamare funzioni in modalità di ragionamento, una limitazione considerata importante nei flussi di lavoro agentici.
La startup aveva annunciato il nuovo modello martedì, sebbene all'epoca fosse disponibile solo su Hugging Face. In una dichiarazione separata, si leggeva che la versione era stata progettata appositamente per funzionare con chip di intelligenza artificiale di nuova generazione di fabbricazione cinese.
Ora, l'azienda ha presentato un nuovo piano tariffario per la sua versione V3 aggiornata. Il piano aumenta alcuni costi, elimina gli sconti serali e riduce i costi per alcune applicazioni, a partire dal 6 settembre.
DeepSeek ha fissato il prezzo per la sua API di input a 0,07 dollari per milione di token per i cache hit e 0,56 dollari per i cache miss, con token di output a 1,68 dollari per milione. Le tariffe sono nettamente inferiori a quelle dei concorrenti: Gemini 2.5 Pro costa 10 dollari per milione di token di output (15 dollari per prompt più lunghi), GPT-5 di OpenAI costa anch'esso 10 dollari e Claude Opus 4.1 di Anthropic arriva fino a 75 dollari.
Gli analisti si aspettavano che DeepSeek rilasciasse il successore di R1 all'inizio di quest'anno
DeepSeek ha scosso per la prima volta la Silicon Valley con il lancio del suo modello di intelligenza artificiale R1, potente ed economico, a gennaio. Da allora, il modello è rimasto in prima linea nella spinta crescente della Cina verso l'intelligenza artificiale, sfidando aziende statunitensi come OpenAI.
Gli osservatori di mercato, tuttavia, sono ancora in attesa del successore di R1, un possibile modello R2, il cui lancio in molti si aspettavano all'inizio di quest'anno. Secondo alcune fonti locali, il ritardo nel lancio sarebbe dovuto all'insistenza del fondatore Liang Wenfeng nel perfezionare il modello. Allo stesso tempo, gestisce anche la sua redditizia attività di High-Flyer Asset Management.
Come già riportato da Cryptopolitan, DeepSeek ha posticipato il lancio del suo modello di intelligenza artificiale R2 a causa di persistenti problemi tecnici con i processori Ascend di Huawei. Dopo il successo del modello R1 a gennaio, DeepSeek era stata incoraggiata dalle autorità cinesi ad adottare i chip Huawei al posto dei prodotti Nvidia di fabbricazione statunitense. Tuttavia, l'azienda ha riscontrato problemi significativi durante la fase di addestramento del modello R2.
Fonti a conoscenza della questione hanno affermato che DeepSeek ha dovuto affidarsi ai chip Nvidia per l'addestramento, utilizzando i processori Ascend di Huawei solo per l'inferenza. Gli addetti ai lavori sottolineano che i chip cinesi, inclusi quelli di Huawei, sono spesso in ritardo rispetto a Nvidia in termini di connettività inter-chip, supporto software e stabilità complessiva.
Huawei ha inviato ingegneri presso gli uffici di DeepSeek per aiutarla ad adattare il modello. Tuttavia, la startup non è riuscita a completare con successo un training sull'hardware Ascend, nemmeno con l'assistenza in loco. Il lancio del modello R2, originariamente previsto per maggio, è stato posticipato a causa di queste problematiche hardware.
Mentre alcuni media cinesi ipotizzano che il nuovo modello potrebbe essere lanciato nelle prossime settimane, il fondatore di DeepSeek, Liang Wenfeng, ha espresso frustrazione interna per i suoi progressi, esortando il team a prendersi il tempo necessario per sviluppare un modello che preservi il vantaggio competitivo dell'azienda.
Nel frattempo, i pesi massimi del settore, tra cui Alibaba e Tencent, continuano a rilasciare aggiornamenti a ritmo serrato, con i modelli Qwen di Alibaba che stannotracun seguito particolarmentetron.
Le menti più brillanti del mondo delle criptovalute leggono già la nostra newsletter. Vuoi partecipare? Unisciti a loro.
Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.
CORSO
- Quali criptovalute possono farti guadagnare
- Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
- Strategie di investimento poco conosciute utilizzate dai professionisti
- Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)















