FREE REPORT: A New Way to Earn Passive Income in 2025 DOWNLOAD

Qwen3 di Alibaba Unseats Deepseek R1, ora guida i modelli AI open source

In questo post:

  • La famiglia dei modelli AI Qwen3 di Alibaba ha superato l'R1 di Deepseek per diventare il miglior modello open source al mondo in aree come l'istruzione linguistica, la matematica, la codifica e l'analisi dei dati. 
  • Qwen3 è economico da utilizzare perché costa solo $ 0,55 per 1 milione di token.
  • I chipmaker americani Nvidia e Intel hanno iniziato a sostenere Qwen3.

La nuova famiglia di modelli AI QWEN3 di Alibaba ha superato l'R1 di Deepseek per diventare il miglior modello open source al mondo. Secondo i rapporti, Qwen3 ha fatto meglio di R1 nei test che misurano le capacità dei modelli AI open source in aree come l'istruzione linguistica, la matematica, la codifica e l'analisi dei dati. 

La famiglia Qwen3 è stata lanciata la scorsa settimana dall'unità cloud computing di Alibaba. Ha otto modelli migliorati con tra 600 milioni e 235 miliardi di parametri. Nell'apprendimento automatico, i parametri sono le variabili in un sistema AI mentre viene addestrato.

Secondo Livebench , una dent che mette alla prova i modelli di grandi dimensioni, prima di questi nuovi test, l'R1 di Deepseek era stata il miglior modello AI open source al mondo da quando è uscito a gennaio. Ma non più.

Sia le compagnie statunitensi che cinesi si affrettano ad adottare Qwen 3

L'ascesa di Qwen3 nelle classifiche Livebench mostra quanto velocemente si sta sviluppando l'IA in Cina. L'industria tecnologica cinese è cresciuta molto grazie agli strumenti open source. Il codice del metodo open source Alibaba ha permesso ad altri sviluppatori di software di terze parti di condividere il design, correggere collegamenti rotti o rendere il programma più potente. 

Tuttavia, i risultati complessivi di Livebench hanno mostrato che Qwen3 non era buono come O3 O3 di Openi, Gemini Pro 2.5 di Google e Claude 3.7 di Antropic, che sono i migliori modelli di AI a source chiusa al mondo. Livebench afferma che il modello AI più popolare di O3-Mini, il modello di AI più popolare di Openi, è stato il migliore al mondo in generale. Microsoft Backs Openai.

Vedi anche  ETH Holdings di Sharplink Gaming salire a 270k dopo $ 48,85 milioni Acquista

Per ogni 1 milione di token, ci vogliono $ 10 per eseguire O3. D'altra parte, Qwen3 è più economico da utilizzare perché costa solo $ 0,55 per 1 milione di token. Poiché Qwen3 è più economico e funziona meglio, molte aziende hanno affermato che avrebbero sostenuto il nuovo modello di AI di Alibaba non appena usciva.

Huawei Technologies, Moore Threads, Cambricon Technologies e Hygon Information Technology sono tutte le società di chip che hanno affermato di supportare Qwen3.

Cambricon ha dichiarato martedì scorso di aver ottimizzato con successo Qwen3 per funzionare rapidamente sulle sue unità di elaborazione grafica. Ciò è stato fatto perché gli sviluppatori di intelligenza artificiale nelle Filippine volevano realizzare patatine in Cina.

Qwen3 viene anche utilizzato sui servizi di cloud computing di iperbolici e fuochi d'artificio.ai, due società di infrastrutture di intelligenza artificiale. I chipmaker americani Nvidia e Intel hanno iniziato a sostenere Qwen3.

Molti big data center in Cina, come quelli di Pechino, Shanghai, Hangzhou e le province di Hubei, Jilin e Northwest Shaanxi, hanno anche detto che useranno i modelli Qwen AI di terza generazione di Alibaba. La rete di supercomputer in Cina ha anche adottato Qwen3. Questa rete collega oltre 20 data center in 20 città in 14 province.

Il CEO antropico afferma che DeepSeek era "un po 'esagerato"

Durante un evento commerciale, un co-fondatore di Antropic, la società che ha realizzato i modelli Claude AI, ha affermato che DeepSeek è ancora "da sei a otto mesi dietro le società di frontiera statunitensi". Ha anche detto che il recente ronzio attorno alla start-up cinese è stato "forse un po 'esagerato".

Vedi anche  JD Vance Slams Federal Reserve, afferma che Powell è "addormentato al volante"

DeepSeek attirò l'attenzione in tutto il mondo alla fine di dicembre 2024 e all'inizio di gennaio 2025 condividendo due modelli AI open source avanzati, V3 e R1. Questi modelli sono stati realizzati per una piccola parte del costo e della potenza di calcolo di cui le grandi aziende tecnologiche di solito hanno bisogno per i progetti LLM.

Non è chiaro quando DeepSeek rilascerà la prossima generazione dei suoi modelli. La società con sede a Hangzhou ha rilasciato in silenzio il suo Prover-V2 da 671 miliardi di parametri a fine aprile . Questo è stato un aggiornamento del suo modello specializzato per la gestione delle prove matematiche. Tuttavia, non ha detto nulla sul progresso del suo tanto atteso modello di ragionamento R2.

Cryptolitan Academy: Vuoi far crescere i tuoi soldi nel 2025? Scopri come farlo con DeFi nella nostra prossima webclass. Salva il tuo posto

Condividi il link:

Disclaimer. Le informazioni fornite non costituiscono consigli di trading. Cryptopolitan.com non si assume alcuna responsabilità per eventuali investimenti effettuati sulla base delle informazioni fornite in questa pagina. Raccomandiamo tron dent e/o la consultazione di un professionista qualificato prima di prendere qualsiasi decisione di investimento .

I più letti

Caricamento degli articoli più letti...

Rimani aggiornato sulle notizie crittografiche, ricevi aggiornamenti quotidiani nella tua casella di posta

La scelta dell'editore

Caricamento articoli scelti dall'editore...

- La newsletter Crypto che ti tiene avanti -

I mercati si muovono velocemente.

Ci muoviamo più velocemente.

Iscriviti al Cryptolitan Daily e diventa intuizioni cripto tempestive, nitide e pertinenti direttamente alla tua casella di posta.

Unisciti ora e
non perdere mai una mossa.

Entra. Ottieni i fatti.
Andare avanti.

Iscriviti a CryptoPolitan