Your bank is using your money. You’re getting the scraps.WATCH FREE

L'ultimo aggiornamento dell'intelligenza artificiale di DeepSeek sfida il modello Qwen3 di Alibaba e o3 di OpenAI

In questo post:

  • DeepSeek ha lanciato R1-0528 come importante impulso al suo modello R1 dopo che Qwen3 di Alibaba lo aveva superato.
  • R1-0528 ora corrisponde ai modelli di grandi aziende tecnologiche come OpenAI o3, o4-mini e Gemini 2.5-Pro ​​di Google.
  • Il team ha condensato la catena di pensiero di R1-0528 in una versione base Qwen3 8B più piccola, che supera l'originale del 10%.

DeepSeek ha lanciato la versione R1-0528, un importante aggiornamento del modello di ragionamento R1 della startup cinese, rilasciato a gennaio. L'aggiornamento è arrivato appena un mese dopo che Qwen3 di Alibaba Group Holding ha superato l'originale DeepSeek R1 in LiveBench, un benchmark online per modelli di intelligenza artificiale open source.

Il modello R1-0528 aggiornato di DeepSeek ora si colloca al livello dei principali modelli di intelligenza artificiale di OpenAI e Google in termini di prestazioni. Questo ritorno dimostra la rapidità con cui le grandi aziende tecnologiche cinesi e le nuove aziende tecnologiche stanno spingendo per migliorare i propri strumenti di intelligenza artificiale.

Nella sua dichiarazione, DeepSeek ha affermato che R1-0528 mostra migliori capacità di ragionamento e scrittura creativa. L'aggiornamento offre anche unatroncapacità di programmazione. Ancora più importante, l'azienda afferma che il modello ora produce il 50% in meno di "allucinazioni"

DeepSeek ha spiegato che gli aggiornamenti derivano dalla potenza di calcolo aggiuntiva investita nella fase di post-addestramento, quando gli ingegneri perfezionano un modello dopo il processo di addestramento principale. Durante la fase di post-addestramento, gli ingegneri mirano ad aumentare l'efficienza del modello e a migliorarne l'accuratezza e la sicurezza.

R1-0528 ora si colloca subito dietro o3 e o4-mini di OpenAI

Su LiveCodeBench, che misura le prestazioni dei modelli di intelligenza artificiale, R1-0528 si colloca ora subito dietro ai modelli o4-mini e o3 di OpenAI.

"L'ultimo aggiornamento di DeepSeek è più preciso nel ragionamento, piùtronnella matematica e nel codice e si avvicina ai modelli di alto livello come Gemini e O3", ha affermato Adina Yakefu, ricercatrice di intelligenza artificiale presso Hugging Face.

Ha aggiunto che la nuova versione mostra "importanti miglioramenti nell'inferenza e nella riduzione delle allucinazioni" e dimostra che la start-up non si sta limitando a recuperare terreno, ma sta anche competendo attivamente.

Vedi anche:  Un sistema di intelligenza artificiale si dimostra promettente nella diagnosi precoce dell'autismo

I rapidi progressi sono avvenuti dopo che Washington ha limitato le esportazioni di chip avanzati e altre tecnologie verso la Cina. Eppure, le aziende cinesi continuano a perfezionare i loro sistemi. All'inizio di questo mese, Baidu e Tencent hanno descritto come stanno rendendo i loro modelli più efficienti nonostante l'accesso limitato a semiconduttori all'avanguardia.

Mercoledì, l'amministratore delegato di Nvidia, Jensen Huang, ha criticato i controlli sulle esportazioni. "Gli Stati Uniti hanno basato la loro politica sul presupposto che la Cina non possa produrre chip di intelligenza artificiale", ha affermato. "Questo presupposto è sempre stato discutibile, e ora è chiaramente sbagliato. La questione non è se la Cina avrà l'intelligenza artificiale. Ce l'ha già"

DeepSeek ha aumentato del 10% le prestazioni del modello Qwen3 8B di Alibaba

DeepSeek ha inoltre affermato di aver distillato i passaggi di ragionamento utilizzati in R1-0528 nel Qwen3 8B di Alibaba. Tale processo ha creato un nuovo modello più piccolo che, secondo l'azienda, ha superato le prestazioni di Qwen3 di oltre il 10%. Allo stesso tempo, il modello era 30 volte più piccolo.

"Riteniamo che la catena di pensiero di DeepSeek-R1-0528 avrà un'importanza significativa per la ricerca accademica sui modelli di ragionamento e per il lavoro industriale sui modelli di piccole dimensioni", ha affermato l'azienda.

Secondo Reuters, un rappresentante di DeepSeek ha dichiarato a un gruppo WeChat che la modifica rappresentava un "piccolo aggiornamento di prova" già disponibile per i test pubblici. In risposta alla concorrenza più agguerrita, Google ha scontato alcuni livelli di accesso a Gemini, mentre OpenAI ha introdotto il modello o3 Mini più economico.

Vedi anche  La Cina accusa la NSA statunitense di "prove inconfutabili" di attacchi informatici contro un'importante agenzia

Le menti più brillanti del mondo delle criptovalute leggono già la nostra newsletter. Vuoi partecipare? Unisciti a loro .

Condividi link:

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamo vivamente di effettuare ricerche indipendenti tron / dent di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

I più letti

Caricamento degli articoli più letti...

Rimani aggiornato sulle novità in ambito criptovalute, ricevi aggiornamenti giornalieri nella tua casella di posta

Scelta dell'editore

Caricamento degli articoli scelti dall'editore...

- La newsletter Crypto che ti tiene al passo -

I mercati si muovono velocemente.

Ci muoviamo più velocemente.

Iscriviti a Cryptopolitan Daily e ricevi direttamente nella tua casella di posta elettronica informazioni tempestive, pertinenti e pertinenti sulle criptovalute.

Iscriviti subito e
non perderti nemmeno una mossa.

Entra. Scopri i fatti.
Vai avanti.

Iscriviti a CryptoPolitan