Venerdì, la startup cinese di intelligenza artificiale DeepSeek ha presentato in anteprima il suo attesissimo modello V4, avviando al contempo per la prima volta una raccolta di finanziamenti esterni. Questi sviluppi hanno scosso alcuni titoli azionari cinesi del settore AI, fatto salire le azioni dei produttori di chip a Hong Kong e nei mercati della Cina continentale e riacceso il dibattito sui chip che alimentano la nuova versione.
L'azienda con sede a Hangzhou ha rilasciato la versione V4 come versione di prova, offrendo agli sviluppatori un accesso anticipato per testarne le funzionalità. Come il suo predecessore, il modello V3, la V4 è open source, il che significa che gli sviluppatori possono scaricare, eseguire e modificare il codice sui propri sistemi. Il modello è disponibile in due dimensioni: una versione "pro" e una versione "flash" più piccola.
DeepSeek ha affermato che V4 offre prestazioni elevate rispetto ai concorrenti nazionali, in particolare nei compiti che coinvolgono agenti di intelligenza artificiale, gestione della conoscenza e inferenza. L'azienda ha inoltre dichiarato che il modello è stato progettato per funzionare con i più diffusi strumenti per agenti, tra cui Claude Code di Anthropic.
Il rilascio arriva più di un anno dopo che il modello di ragionamento R1 di DeepSeek ha scosso i mercati tecnologici globali. Quando R1 è stato presentato nel gennaio 2025, ha eguagliato o superato molti dei principali modelli di intelligenza artificiale e DeepSeek ha rivelato che ci sono voluti solo due mesi e meno di 6 milioni di dollari per realizzarlo, utilizzando chip Nvidia di fascia bassa. Questa rivelazione ha scosso gli investitori e sollevato interrogativi sul primato degli Stati Uniti nell'IA, nonché sulle ingenti spese delle grandi aziende tecnologiche per le infrastrutture di intelligenza artificiale.
L'azienda si trova ora ad affrontare una concorrenza crescente nel fiorente settore dell'intelligenza artificiale in Cina. Alibaba e ByteDance sono tra le aziende che hanno lanciato nuovi modelli quest'anno. Venerdì, il lancio della versione 4 ha fatto scendere le azioni di diverse società cinesi di intelligenza artificiale a Hong Kong.
Zhipu AI ha registrato un calo di circa l'8-9%, MiniMax è scesa di circa il 7-8% e Manycore Tech ha perso il 9%.
I titoli dei produttori di chip, tuttavia, si sono mossi nella direzione opposta, poiché il rilascio del V4 ha alimentato l'ottimismo sulla domanda trainata dall'intelligenza artificiale.
Semiconductor Manufacturing International Corp, il più grande produttore di chip del paese per volume, ha registrato un balzo dell'11% a Hong Kong, mentre Hua Hong Semiconductor ha guadagnato oltre il 18%.
Sulla terraferma, Cambricon Technologies e Moore Threads Technology hanno guadagnato tra il 4% e il 6% ciascuna, mentre Hygon Information Technology è salita di oltre il 10%.
Quali chip sono stati utilizzati per addestrare DeepSeek V4?
Una delle domande più frequenti dopo il lancio riguarda l'hardware utilizzato da DeepSeek. Secondo Reuters, Huawei ha confermato venerdì che il suo supernodo basato su Ascend 950 è compatibile con il modello V4 e ha affermato che l'intera gamma dei suoi sistemi ad alte prestazioni ora funziona con la serie V4.
Tuttavia, DeepSeek non ha specificato quali chip abbia utilizzato per addestrare il modello, lasciando la questione senza risposta.
A causa delle restrizioni all'esportazione imposte dagli Stati Uniti a partire dal 2022, gli sviluppatori cinesi di intelligenza artificiale non possono acquistare i chip più avanzati di Nvidia. Da allora, Pechino ha spinto le sue aziende tecnologiche verso alternative nazionali, come i produttori di chip Huawei.
Il lancio del V4 è avvenuto un giorno dopo che la Casa Bianca ha accusato la Cina di aver rubato la proprietà intellettuale dei laboratori di intelligenza artificiale statunitensi su scala industriale, un'accusa che potrebbe mettere a dura prova le relazioni in vista del vertice tra i leader statunitensi e cinesi previsto per il mese prossimo.
DeepSeek è stata al centro di questa controversia, con Washington che l'ha accusata di aver ottenuto chip Nvidia soggetti a restrizioni e con aziende come Anthropic e OpenAI che l'hanno accusata di aver copiato impropriamente i loro modelli proprietari. L'ambasciata cinese a Washington ha respinto quelle che ha definito "accuse infondate"
Raccolta fondi per trattenere i ricercatori
Come riportato in precedenza da Cryptopolitan , DeepSeek è in trattative con un piccolo gruppo di investitori strategici, tra cui Tencent e Alibaba, per raccogliere fondi con una valutazione superiore a 20 miliardi di dollari, la sua prima raccolta fondi esterna.
La cifra prevista si aggira sulle poche centinaia di milioni di dollari, ben al di sotto dei miliardi solitamente raccolti da aziende simili. Moonshot, che gestisce i modelli di intelligenza artificiale Kimi, era stata valutata l'ultima volta 18 miliardi di dollari, mentre MiniMax e Zhipu hanno valutazioni rispettivamente di 34 e 58 miliardi di dollari.
La raccolta fondi non è motivata da un'urgente necessità di cash , ma principalmente dalla volontà di trattenere i ricercatori, secondo quanto riferito da alcune fonti al Financial Times. Alcuni ricercatori hanno lasciato l'azienda per passare a società concorrenti le cui valutazioni sono aumentate vertiginosamente nell'ultimo anno. Le stock option costituiscono una parte consistente, se non la maggioranza, dello stipendio di un ricercatore nel campo dell'intelligenza artificiale e, senza una chiara valutazione, DeepSeek ha faticato a competere.
Guo Daya, uno degli autori principali dell'articolo R1, è entrato a far parte di ByteDance, mentre Wang Bingxuan, veterano del team di addestramento dei modelli di DeepSeek, è passato a Tencent.
Il fondatore Liang Wenfeng, che ha finanziato l'azienda tramite la sua società di trading quantitativo, sta valutando anche altre opzioni per stabilire una valutazione, tra cui un riacquisto di azioni proprie o un metodo di valutazione basato sulle prestazioni, nel caso in cui non si raggiungano i termini per la raccolta fondi.
Foto di 