La nuova famiglia di modelli AI QWEN3 di Alibaba ha superato l'R1 di Deepseek per diventare il miglior modello open source al mondo. Secondo i rapporti, Qwen3 ha fatto meglio di R1 nei test che misurano le capacità dei modelli AI open source in aree come l'istruzione linguistica, la matematica, la codifica e l'analisi dei dati.
La famiglia Qwen3 è stata lanciata la scorsa settimana dall'unità cloud computing di Alibaba. Ha otto modelli migliorati con tra 600 milioni e 235 miliardi di parametri. Nell'apprendimento automatico, i parametri sono le variabili in un sistema AI mentre viene addestrato.
Secondo Livebench , una dent che mette alla prova i modelli di grandi dimensioni, prima di questi nuovi test, l'R1 di Deepseek era stata il miglior modello AI open source al mondo da quando è uscito a gennaio. Ma non più.
Sia le compagnie statunitensi che cinesi si affrettano ad adottare Qwen 3
L'ascesa di Qwen3 nelle classifiche Livebench mostra quanto velocemente si sta sviluppando l'IA in Cina. L'industria tecnologica cinese è cresciuta molto grazie agli strumenti open source. Il codice del metodo open source Alibaba ha permesso ad altri sviluppatori di software di terze parti di condividere il design, correggere collegamenti rotti o rendere il programma più potente.
Tuttavia, i risultati complessivi di Livebench hanno mostrato che Qwen3 non era buono come O3 O3 di Openi, Gemini Pro 2.5 di Google e Claude 3.7 di Antropic, che sono i migliori modelli di AI a source chiusa al mondo. Livebench afferma che il modello AI più popolare di O3-Mini, il modello di AI più popolare di Openi, è stato il migliore al mondo in generale. Microsoft Backs Openai.
Per ogni 1 milione di token, ci vogliono $ 10 per eseguire O3. D'altra parte, Qwen3 è più economico da utilizzare perché costa solo $ 0,55 per 1 milione di token. Poiché Qwen3 è più economico e funziona meglio, molte aziende hanno affermato che avrebbero sostenuto il nuovo modello di AI di Alibaba non appena usciva.
Huawei Technologies, Moore Threads, Cambricon Technologies e Hygon Information Technology sono tutte le società di chip che hanno affermato di supportare Qwen3.
Cambricon ha dichiarato martedì scorso di aver ottimizzato con successo Qwen3 per funzionare rapidamente sulle sue unità di elaborazione grafica. Ciò è stato fatto perché gli sviluppatori di intelligenza artificiale nelle Filippine volevano realizzare patatine in Cina.
Qwen3 viene anche utilizzato sui servizi di cloud computing di iperbolici e fuochi d'artificio.ai, due società di infrastrutture di intelligenza artificiale. I chipmaker americani Nvidia e Intel hanno iniziato a sostenere Qwen3.
Molti big data center in Cina, come quelli di Pechino, Shanghai, Hangzhou e le province di Hubei, Jilin e Northwest Shaanxi, hanno anche detto che useranno i modelli Qwen AI di terza generazione di Alibaba. La rete di supercomputer in Cina ha anche adottato Qwen3. Questa rete collega oltre 20 data center in 20 città in 14 province.
Il CEO antropico afferma che DeepSeek era "un po 'esagerato"
Durante un evento commerciale, un co-fondatore di Antropic, la società che ha realizzato i modelli Claude AI, ha affermato che DeepSeek è ancora "da sei a otto mesi dietro le società di frontiera statunitensi". Ha anche detto che il recente ronzio attorno alla start-up cinese è stato "forse un po 'esagerato".
DeepSeek attirò l'attenzione in tutto il mondo alla fine di dicembre 2024 e all'inizio di gennaio 2025 condividendo due modelli AI open source avanzati, V3 e R1. Questi modelli sono stati realizzati per una piccola parte del costo e della potenza di calcolo di cui le grandi aziende tecnologiche di solito hanno bisogno per i progetti LLM.
Non è chiaro quando DeepSeek rilascerà la prossima generazione dei suoi modelli. La società con sede a Hangzhou ha rilasciato in silenzio il suo Prover-V2 da 671 miliardi di parametri a fine aprile . Questo è stato un aggiornamento del suo modello specializzato per la gestione delle prove matematiche. Tuttavia, non ha detto nulla sul progresso del suo tanto atteso modello di ragionamento R2.
Cryptolitan Academy: Vuoi far crescere i tuoi soldi nel 2025? Scopri come farlo con DeFi nella nostra prossima webclass. Salva il tuo posto