DeepSeek, una società di intelligenza artificiale con sede in Cina, ha lanciato DeepSeek-R1-Lite-Preview per migliorare le capacità di ragionamento e di risoluzione dei problemi. Annunciato in un post su X, il sistema si posiziona come concorrente di leader del settore come OpenAI.
I commentatori ritengono che la trasparenza di DeepSeek sia ironica quando le aziende occidentali non hanno colmato queste lacune.
calcoli migliori
DeepSeek, una società di intelligenza artificiale con sede in Cina, ha introdotto una nuova versione del suo sistema di intelligenza artificiale chiamata DeepSeek-R1-Lite-Preview. In un post su X, si afferma che il nuovo sistema di intelligenza artificiale ha migliorato le capacità di ragionamento e di risoluzione dei problemi.
Secondo DeepSeek , l’anteprima si comporta bene con benchmark come AIME (American Invitational Mathematics matic ) e MATH, che misurano le capacità di problem solving e di ragionamento. Poiché l'intelligenza artificiale sembra abile nel gestire matic e logici complessi, potrebbe essere pronta a competere con ChatGPT di OpenAI e in particolare con OpenAI o1.
Questa settimana, Le Chat di Mistral AI ha anche annunciato aggiornamenti per consentire l'accesso gratuito a nuove funzionalità. Sembra che i lanci stiano creando un’intensa concorrenza nel mercato dell’intelligenza artificiale generativa, superando le carenze dell’altro.
DeepSeek pensa ad alta voce a differenza di ChatGPT
DeepSeek afferma che la sua intelligenza artificiale può mostrare il ragionamento passo dopo passo in tempo reale per rendere il suo processo di pensiero più trasparente. Nel frattempo, la società di intelligenza artificiale ha anche affermato che rilascerà il modello open source e gli strumenti di sviluppo API nei prossimi giorni.
Secondo un grafico comparativo citato dal commentatore tecnologico e AI Andrew Curran, DeepSeek-R1-Lite-Preview ottiene il punteggio più alto in parametri come AIME (52,5) e Codeforces (1450), superando concorrenti come OpenAI o1-preview e Claude 3.5 Sonnet.
È anche in testa in MATH-500 (91.6), indicando prestazioni elevate in compiti avanzati di risoluzione dei problemi. Tuttavia, è in ritardo in GPQA Diamond (58,5) e Zebra Logic (56,6) rispetto a modelli come OpenAI o1-preview (73,3 e 71,4, rispettivamente). Le cifre indicano che c'è margine di miglioramento nei segmenti della conoscenza generale e del ragionamento logico.
Due mesi dopo l'annuncio dell'anteprima di o1, il suo ragionamento basato sulla catena di pensiero è stato replicato. La Balena ora può ragionare. DeepSeek afferma che la versione ufficiale di DeepSeek-R1 sarà completamente open source. https://t.co/Ya9mVyLvDP pic.twitter.com/6wZ8xoAyyz
— Andrew Curran (@AndrewCurran_) 20 novembre 2024
Cryptopolitan ha provato le funzionalità del lancio per una recensione imparziale. Innanzitutto, la chat di DeepSeek richiede l'accesso dell'utente. La chat con la funzione "Pensare in profondità" limita le conversazioni a un massimo di 50 messaggi al giorno. Possiamo dire che Deepseek pensa ad alta voce e allo stesso tempo stima il tempo di risposta. Ha anche risolto il problema di matematica che abbiamo presentato in ordine logico. In confronto, ChatGPT 4o ha impiegato meno tempo per la soluzione ma non ha presentato un ragionamento passo passo per la stessa .
L'influencer Bilawal Sidhu ha ironizzato su o1 e ha dichiarato: " È ironico che il modello o1 di OpenAI nasconda il suo ragionamento basato sulla catena di pensiero, mentre il cinese DeepSeek-R1 lo rende trasparente agli utenti. Non dovrebbe essere il contrario?”
Detto questo, la Cina dispone di un quadro sull’intelligenza artificiale. Il 13 luglio 2023, diverse autorità cinesi, tra cui la Cyberspace Administration of China (CAC) e il Ministero dell’Istruzione, hanno introdotto nuove normative per le tecnologie di intelligenza artificiale generativa. Queste regole, chiamate Regolamento sull’intelligenza artificiale generativa, sono entrate ufficialmente in vigore lo scorso 15 agosto.
Secondo quanto riferito, l’ambito di applicazione del regolamento copre l’uso di algoritmi, tecnologie di sintesi profonda, l’uso di tutte le tecnologie di intelligenza artificiale generativa e diverse altre attività tecnologiche. E con il suo approccio di ragionamento trasparente, tron prestazioni rispetto ai benchmark competitivi e piani per il rilascio di strumenti open source, DeepSeek sta spingendo i confini dell’intelligenza artificiale generativa in Cina e tra i suoi concorrenti a livello globale.
Un sistema passo dopo passo per avviare la tua carriera Web3 e ottenere lavori ben pagati nel settore delle criptovalute in 90 giorni.