ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

Qwen3 di Alibaba scalza R1 di DeepSeek e diventa leader nei modelli di intelligenza artificiale open source

DiFirenze MuchaiFirenze Muchai
Tempo di lettura: 3 minuti.
  • La famiglia di modelli di intelligenza artificiale Qwen3 di Alibaba ha superato R1 di DeepSeek, diventando il miglior modello open source al mondo in settori quali l'insegnamento delle lingue, la matematica, la codifica e l'analisi dei dati. 
  • Qwen3 è economico da usare perché costa solo 0,55 $ per 1 milione di token.
  • I produttori di chip americani Nvidia e Intel hanno iniziato a supportare Qwen3.

La nuova famiglia di modelli di intelligenza artificiale Qwen3 di Alibaba ha superato R1 di DeepSeek, diventando il miglior modello open source al mondo. Secondo alcuni report, Qwen3 ha ottenuto risultati migliori di R1 nei test che misurano le capacità dei modelli di intelligenza artificiale open source in aree come l'insegnamento delle lingue, la matematica, la programmazione e l'analisi dei dati. 

La famiglia Qwen3 è stata lanciata la scorsa settimana dalla divisione cloud computing di Alibaba. Comprende otto modelli migliorati con un numero di parametri compreso tra 600 milioni e 235 miliardi. Nell'apprendimento automatico, i parametri sono le variabili di un sistema di intelligenza artificiale durante l'addestramento.

Secondo la LiveBench , una piattaforma indipendentedent testa modelli linguistici di grandi dimensioni, prima di questi nuovi test, R1 di DeepSeek era stato il miglior modello di intelligenza artificiale open-source al mondo sin dal suo rilascio a gennaio. Ma non più.

Sia le aziende statunitensi che quelle cinesi si affrettano ad adottare Qwen 3

L'ascesa di Qwen3 nella classifica di LiveBench mostra la rapidità con cui l'intelligenza artificiale si sta sviluppando in Cina. L'industria tecnologica cinese è cresciuta notevolmente grazie agli strumenti open source. Il codice open source di Alibaba ha permesso ad altri sviluppatori di software di terze parti di condividere il design, correggere link non funzionanti o rendere il programma più potente. 

Tuttavia, i risultati complessivi di LiveBench hanno mostrato che Qwen3 non era all'altezza di o3 di OpenAI, Gemini Pro 2.5 di Google e Claude 3.7 di Anthropic, che sono i migliori modelli di intelligenza artificiale closed-source al mondo. LiveBench afferma che o3-mini high, il modello di intelligenza artificiale più popolare di OpenAI, è stato il migliore al mondo in assoluto. Microsoft sostiene OpenAI.

Per ogni milione di token, occorrono 10 dollari per gestire o3. D'altra parte, Qwen3 è più economico da utilizzare perché costa solo 0,55 dollari per milione di token. Poiché Qwen3 è più economico e funziona meglio, molte aziende hanno dichiarato che avrebbero sostenuto il nuovo modello di intelligenza artificiale di Alibaba non appena fosse uscito.

Huawei Technologies, Moore Threads, Cambricon Technologies e Hygon Information Technology sono tutte aziende produttrici di chip che hanno dichiarato che supporteranno Qwen3.

Martedì scorso, Cambricon ha dichiarato di aver ottimizzato con successo Qwen3 per renderlo più veloce sulle sue unità di elaborazione grafica. Questo perché gli sviluppatori di intelligenza artificiale nelle Filippine volevano chip prodotti in Cina.

Qwen3 viene utilizzato anche nei servizi di cloud computing di Hyperbolic e Fireworks.ai, due aziende di infrastrutture di intelligenza artificiale. I produttori di chip americani Nvidia e Intel hanno iniziato a supportare Qwen3.

Molti grandi data center in Cina, come quelli di Pechino, Shanghai, Hangzhou e delle province di Hubei, Jilin e Shaanxi nord-occidentale, hanno dichiarato che utilizzeranno i modelli di intelligenza artificiale Qwen di terza generazione di Alibaba. Anche la rete di supercalcolo cinese ha adottato Qwen3. Questa rete collega oltre 20 data center in 20 città di 14 province.

Il CEO di Anthropic afferma che DeepSeek è stato "un po' esagerato"

Durante un evento aziendale, un co-fondatore di Anthropic, l'azienda che ha realizzato i modelli di intelligenza artificiale di Claude, ha affermato che DeepSeek è ancora "da sei a otto mesi indietro rispetto alle aziende di frontiera statunitensi". Ha anche affermato che il recente entusiasmo attorno alla startup cinese era "forse un po' esagerato"

DeepSeek ha attirato l'attenzione di tutto il mondo tra la fine di dicembre 2024 e l'inizio di gennaio 2025 condividendo due modelli avanzati di intelligenza artificiale open source, V3 e R1. Questi modelli sono stati realizzati con una frazione del costo e della potenza di calcolo di cui le grandi aziende tecnologiche solitamente necessitano per i progetti LLM.

Non è chiaro quando DeepSeek rilascerà la prossima generazione dei suoi modelli. L'azienda con sede a Hangzhou ha rilasciato in sordina il suo Prover-V2 da 671 miliardi di parametri alla fine di aprile. Si trattava di un aggiornamento del suo modello specializzato per la gestione delle dimostrazioni matematiche. Tuttavia, non ha fornito alcuna informazione sui progressi del suo attesissimo modello di ragionamento R2.

Continui a lasciare che la banca si tenga la parte migliore? Guarda il nostro video gratuito su come diventare la tua banca.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

ALTRE NOTIZIE
INTENSIVO CRIPTOVALUTE
CORSO