ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

DeepSeek svela un nuovo metodo di ragionamento basato sull'intelligenza artificiale in attesa del suo modello di prossima generazione

DiOwotunse AdebayoOwotunse Adebayo
Tempo di lettura: 3 minuti.
Deepseek svela un nuovo metodo di ragionamento basato sull'intelligenza artificiale, in attesa del suo modello di prossima generazione.
  • La startup cinese di intelligenza artificiale DeepSeek ha presentato un nuovo metodo di ragionamento basato sull'intelligenza artificiale, in attesa che il mercato ne sviluppi il modello di prossima generazione.
  • DeepSeek svela un nuovo metodo di ragionamento basato sull'intelligenza artificiale, mentre l'azienda mantiene il massimo riserbo su un possibile rilascio del modello R2.
  • La startup cinese di intelligenza artificiale si è concentrata sulla ricerca e sullo sviluppo, rilasciando la versione aggiornata del suo modello V3.

La startup cinese di intelligenza artificiale (IA), DeepSeek, ha svelato un nuovo metodo di ragionamento, mentre il mercato continua ad attendere il lancio del suo modello di nuova generazione. Secondo alcune indiscrezioni, l'azienda ha appena introdotto un nuovo approccio che migliorerà le capacità di ragionamento dei modelli linguistici di grandi dimensioni (LLM), mentre il pubblico attende il lancio del suo nuovo modello.

Secondo quanto riportato, un articolo pubblicato di recente ha rivelato che l'impresa è stata raggiunta grazie a una collaborazione tra i ricercatori dell'Università di Tsinghua e la startup di intelligenza artificiale. Secondo l'articolo, DeepSeek è riuscita a sviluppare una tecnica che combina metodi noti come modellazione generativa della ricompensa (GRM) e ottimizzazione basata su principi. Questo duplice approccio consentirà agli LLM di fornire risultati migliori e più rapidi alle query generali.

DeepSeek svela un nuovo metodo di ragionamento basato sull'intelligenza artificiale

Secondo i ricercatori, i modelli DeepSeek-GRM risultanti sono stati in grado di superare i metodi esistenti, raggiungendo prestazioni competitive contronmodelli di ricompensa pubblici. La modellazione della ricompensa è un processo che aiuta un LLM a determinare le preferenze umane. I ricercatori hanno affermato che la startup di intelligenza artificiale intende rendere i modelli GRM open source, ma l'azienda non ha ancora fornito una tempistica per lo sviluppo.

La pubblicazione del documento di ricerca accademica segue le speculazioni sulla potenziale mossa successiva della startup, dopo enjgoduto dell'attenzione globale suscitata dal suo modello di base DeepSeek V3 e dal suo modello di ragionamento R1. All'epoca, il modello R1, rilasciato all'inizio di quest'anno, aveva guadagnato importanza dopo aver scoperto di avere prestazioni migliori rispetto ad alcuni modelli precedenti, tra cui il primo modello ChatGPT di OpenAI.

Il rilascio del modello R1 ha colto di sorpresa anche la Silicon Valley, considerando che il modello era open source e completato con una frazione dei costi impiegati per altri modelli di intelligenza artificiale. Sebbene l'attenzione sembri rallentare, si sono registrati notevoli progressi tra le aziende rivali nel settore dell'intelligenza artificiale, a dimostrazione di una rivalità che durerà per sempre.

Tuttavia, un rapporto di Reuters del mese scorso ha menzionato che DeepSeek-2, il successore del celebre R1, potrebbe essere in lavorazione. Secondo il rapporto, l'azienda potrebbe puntare a lanciarlo verso la fine di questo mese, nel tentativo di capitalizzare sulla sua crescente importanza nel settore dell'intelligenza artificiale. DeepSeek, d'altra parte, è rimasta a bocca cucita sul modello R2, mantenendo il silenzio sui canali ufficiali, con un account del servizio clienti che ha smentito le indiscrezioni con i clienti aziendali, secondo quanto riportato.

Continua lo sviluppo del modello V3

DeepSeek, con sede a Hangzhou, è stata fondata nel 2023 dall'imprenditore Liang Wenfeng e negli ultimi mesi è stata al centro dell'attenzione mondiale per le giuste ragioni. Tuttavia, l'azienda si è rifiutata di rendere pubbliche le sue dichiarazioni, decidendo di concentrare tutto il suo tempo e le sue energie su ricerca e sviluppo. Resta da vedere cosa l'azienda abbia in serbo per il settore dell'intelligenza artificiale, ma le indiscrezioni hanno sicuramente fatto notizia.

Il mese scorso, l'azienda ha annunciato uno sviluppo su cui stava lavorando, presentando al mondo il suo modello V3 aggiornato denominato DeepSeek-V3-0324. Secondo l'azienda, il modello aggiornato offriva "capacità di ragionamento migliorate, sviluppo web front-end ottimizzato e una migliore competenza nella scrittura in cinese". A febbraio, l'azienda ha esternalizzato cinque dei suoi repository di codice, consentendo agli sviluppatori di revisionare e contribuire allo sviluppo del software. La startup ha affermato che avrebbe compiuto "progressi sinceri in piena trasparenza"

Nello stesso mese, Liang ha pubblicato uno studio tecnico sull'attenzione sparsa nativa, un metodo utilizzato per migliorare l'efficienza dei modelli lineari generalizzati (LLM) nell'elaborazione di grandi quantità di dati. Il quarantenne Liang è anche il fondatore di High-Flyer Quant, la società madre di DeepSeek, il fondo speculativo che ha fornito le risorse finanziarie necessarie per finanziare i progressi tecnologici della startup di intelligenza artificiale. Alla fine di febbraio, l'imprenditore ha partecipato a un simposio che ha riunito imprenditori del settore tecnologico,dentdentdent dentdentdentdent dentdent la startup come segno della resilienza del Paese di fronte alle mosse degli Stati Uniti per contenere i progressi della Cina nel campo dell'IA.

Se stai leggendo questo, sei già un passo avanti. Rimani al passo con i tempi iscrivendoti alla nostra newsletter.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

ALTRE NOTIZIE
INTENSIVO CRIPTOVALUTE
CORSO