Il nuovo modello AI QwQ-32B-Preview di Alibaba supera l'o1 di OpenAI in alcuni benchmark

- Il modello di Alibaba ha superato OpenAI in benchmark come AIME e MATH.
- Il modello potrebbe rappresentare un passo avanti verso l'intelligenza artificiale razionale.
- Tuttavia, anche il modello ha i suoi limiti.
Con l'intensificarsi della concorrenza nel campo dell'intelligenza artificiale, il colosso cinese della vendita al dettaglio Alibaba ha presentato il suo QwQ-32B-Preview che, a quanto pare, supera la serie o1 di OpenAI.
Secondo quanto riferito, l'ultimo modello supera i modelli o1-preview e o1-mini di OpenAI in alcuni benchmark specifici, come i test AIME e MATH, che valutano le prestazioni dei modelli di intelligenza artificiale nei puzzle logici e nei problemi matematici.
Alibaba ha reso disponibile per il download QwQ-32B-Preview.
Secondo il colosso della vendita al dettaglio, il nuovo modello di Alibaba è in grado di affrontare problemi complessi e intricati rispetto ai normali modelli di linguaggio di grandi dimensioni (LLM) come ChatGPT-4 e Claude 3.5.
Un articolo di Benzinga indica che il QwQ-32B-Preview è uno dei pochi modelli disponibili con licenza permissiva, che consente agli utenti di scaricarlo e utilizzarlo. Il modello è ora disponibile sulla piattaforma di sviluppo AI Hugging Face.
Tuttavia, Alibaba ha rilasciato alcuni componenti del modello per limitarne la replicazione completa o la comprensione del suo funzionamento.
L'ultimo modello di Alibaba vanta 32,5 miliardi di parametri, che gli consentono di gestire prompt fino a 32.000 parole. Grazie alle notevoli capacità del modello e all'accessibilità semi-aperta, il nuovo arrivato di Alibaba apre la strada a un balzo in avanti radicale nelle tecnologie di ragionamento basate sull'intelligenza artificiale.
L'annuncio trasparente di Alibaba, che sottolinea la sofisticatezza del suo modello, OpenAI ha mantenuto segreti i conteggi dei parametri.
L'avvento di questo modello arriva in un momento in cui OpenAI sta compiendo passi da gigante nel settore dell'intelligenza artificiale. A ottobre, la valutazione di OpenAI è balzata a 157 miliardi di dollari a seguito di un round di finanziamento di successo.
All'inizio di questa settimana, SoftBank Group SFTBF avrebbe aumentato la sua partecipazione nel produttore di ChatGPT tramite un buyout di azioni da parte dei dipendenti per 1,5 miliardi di dollari.
Si dice anche che OpenAI stia valutando lo sviluppo di un proprio browser web per sfidare Google Chrome, la sussidiaria di Alphabet, dopo le pressioni del Dipartimento di Giustizia degli Stati Uniti affinché ne disinvesta.
Alibaba ammette che anche il modello ha dei difetti
Sebbene presenti alcuni punti di forza unici, il nuovo modello presenta anche dei limiti. Secondo il gruppo, QwQ-32B-Preview presenta problemi come cambi di lingua imprevisti, che potrebbero potenzialmente confondere gli utenti. Il modello presenta inoltre prestazioni insufficienti in compiti che richiedono ragionamenti basati sul buon senso, comuni a molti sistemi di intelligenza artificiale.
Secondo AutoGPT, il modello potrebbe rimanere intrappolato in loop logici, ritardando le risposte.
Nonostante i suoi difetti, le sue capacità di ragionamento gli consentono di verificare autonomamente i fatti, riducendo così gli errori ma aumentando i tempi di risoluzione.
Ragionando sui compiti e pianificando le fasi, il modello di Alibaba evita alcune insidie che affliggono i sistemi di intelligenza artificiale tradizionali. Tuttavia, questo approccio richiede tempi più lunghi, il che potrebbe limitarne l'applicazione in tempo reale.
Secondo Benzinga, le risposte del QwQ-32B-Preview sono in linea con gli standard normativi cinesi, evitando argomenti politicamente sensibili.
Ad esempio, argomenti politicamente delicati come Taiwan daranno risposte in linea con la posizione del governo cinese.
Inoltre, le richieste relative ad eventi come Piazza Tienanmen non generano alcuna risposta, il che dimostra la cautela progettuale del modello.
Sebbene questa soluzione possa essere ideale per il mercato cinese, potrebbe anche limitarne l'attrattiva sul mercato globale. Tuttavia, il modello rappresenta un passo significativo nel mondo dell'intelligenza artificiale basata sul ragionamento. Sebbene i suoi limiti possano limitarne l'attrattiva globale, altri componenti, come la logica e la natura semi-aperta, lo rendono un grande concorrente per OpenAI.
Secondo AutoGPT, QwQ-32B-Preview evidenzia il potenziale e le sfide di questa entusiasmante frontiera in cui i laboratori di intelligenza artificiale di tutto il mondo stanno lavorando per perfezionare la tecnologia del ragionamento.
Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.
Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.
CORSO
- Quali criptovalute possono farti guadagnare
- Come rafforzare la sicurezza del tuo portafoglio digitale (e quali sono quelli davvero validi)
- Strategie di investimento poco conosciute utilizzate dai professionisti
- Come iniziare a investire in criptovalute (quali piattaforme di scambio utilizzare, le migliori criptovalute da acquistare, ecc.)














