Alibaba ha annunciato una nuova versione del suo modello di intelligenza artificiale Qwen 2.5 mercoledì, il primo giorno dell'anno lunare in Cina. La compagnia tecnologica cinese ha sostenuto che Qwen 2.5 ha superato il tanto acclamato Deepseek-V3.
Alibaba ha pubblicato sul suo account WeChat ufficiale che Qwen 2.5-Max ha superato quasi tutti i modelli di intelligenza artificiale, tra cui GPT-40, Deepseek-V3 e Llama-3.1-405b. Le notizie dell'azienda sono arrivate sulla scia del rilascio di Ai Assistant di DeepSeek (DeepSeek-V3) il 10 gennaio e la pubblicazione del 20 gennaio del suo modello R1.
La recente uscita del modello R1 di Deepseek ha inviato un'onda d'urto nelle scorte di azioni delle società tecnologiche statunitensi, in particolare Nvidia. DeepSeek ha affermato di aver creato il modello R1 con soli $ 6 miliardi rispetto ai miliardi di dollari che altre aziende tecnologiche statunitensi spendono nello spazio dell'IA.
La società tecnologica ha anche causato un certo slancio nel proprio mercato interno, con altre aziende tecnologiche cinesi che si affrettano a rilasciare aggiornamenti ai loro modelli AI. Un rapporto di Reuters ha rivelato che due giorni dopo il rilascio di DeepSeek-R1, Bytedance ha anche rilasciato un aggiornamento al suo modello di AI di punta. La società madre di Tiktok ha sostenuto che supera la O1 di Openai sostenuta da Microsoft nei test che misurano il modo in cui i modelli di intelligenza artificiale hanno compreso e risposto a istruzioni complesse.
Alibaba rilascia la sua nuova versione del modello Qwen2.5 AI
L'esplosione di Deepseek V3 ha attirato trac attenzione dell'intera comunità di intelligenza artificiale ai modelli MOE su larga scala. Allo stesso tempo, abbiamo costruito Qwen2.5-Max, un grande MOE LLM pretratto su dati enormi e post-addestrato con ricette SFT e RLHF curate. Raggiunge competitivo ... pic.twitter.com/ohvl16vfje
- Qwen (@alibaba_qwen) 28 gennaio 2025
La società tecnologica cinese ha annunciato lunedì che il nuovo modello di intelligenza artificiale, Qwen2.5-VL, potrebbe eseguire una serie di attività di analisi di testo e immagini. L'azienda ha anche affermato che Qwen2.5 era simile all'operatore recentemente lanciato da Mody Openai. Il modello AI può comprendere i video, i file di analizza e contano oggetti nelle immagini, nonché controllare un PC.
Secondo i test di benchmarking condotti dal team Qwen, il modello Qwen2.5-VL supera GPT-40 di Openi, sonetto Claude 3.5 di Antropic e Google's Gemini 2.0 Flash. Il nuovo modello di intelligenza artificiale potrebbe battere i suoi rivali nella comprensione video, matematica, analisi dei documenti e valutazioni delle risposte.
Alibaba ha confermato che Qwen2.5-VL era disponibile per i test nella sua app di chat Qwen e per il download dalla piattaforma AI Dev che abbraccia la faccia. Il team Qwen ha affermato che il modello AI può analizzare grafici e grafici, i dati extracdi scansioni di fatture e forme e "comprendere" video di più ore di più ore. Il modello AI può anche riconoscere IP da film e serie TV, nonché un'ampia varietà di prodotti.
Il team di Qwen ha rivelato che il modello aveva alcune restrizioni sugli argomenti di cui poteva discutere nella chat di Qwen a causa del fatto che l'IA è stata sviluppata da una società cinese. Secondo il team, il regolatore di Internet in Cina misura molti modelli sviluppati nel paese per garantire che le loro risposte "incarnino valori socialisti di base". Diverse aziende cinesi di intelligenza artificiale, come Ernie , deviano anche le risposte a argomenti che potrebbero aumentare l'ira dei regolatori o che potrebbero essere considerate troppo sensibili.
Il team di Qwen rivela le capacità di Qwen2.5-VL
Il team Dev di Qwen2.5-VL ha rivelato che una delle caratteristiche interessanti del modello AI è la sua capacità di interagire con il software, sia su PC che su dispositivi mobili. Philipp Schmid, un vantaggio tecnico di Hugging Face, ha mostrato il modello AI che lanciava l'app Booking.com per Android e prenota un volo da Chongqing a Pechino.
“Nonostante tutto l'hype di DeepSeek, Qwenn ha appena lasciato cadere il miglior multimodale aperto! Qwen 2.5 VL è un modello di linguaggio della visione in grado di controllare il tuo computer, simile all'operatore Openai, informazioni strutturate extracdai grafici e altro !! "
- Philipp Schmid , guida tecnologica in faccia abbraccio
Vaibhav Srivastav, data scientist di Hugging Face, ha mostrato come il modello Qwen2.5-VL controlla le app su un desktop Linux ma non è riuscito a realizzare molto oltre le schede di commutazione. La dimostrazione in linea con il benchmarking di Qwen, che ha mostrato che Qwen2.5-VL ha ottenuto un punteggio male su Osworld, un punto di riferimento che cerca di imitare un vero ambiente informatico.
La società cinese AI Tech ha anche rivelato che i due modelli più piccoli e meno sofisticati nella serie Qwen2.5VL, Qwen2.5-VL-3B e Qwen2.5-VL-7b, erano disponibili in licenze permissive. L'ammiraglia Qwen2.5-VL-7B sarà ancora sotto la licenza personalizzata di Alibaba, che richiede che le aziende e i Devs con oltre 100 milioni di utenti attivi mensili richiedano l'autorizzazione da Qwen o Alibaba prima di distribuire commercialmente il modello AI.
Cryptolitan Academy: stanco delle oscillazioni del mercato? Scopri come DeFi può aiutarti a costruire un reddito passivo costante. Registrati ora