ULTIME NOTIZIE
SELEZIONATO PER TE
SETTIMANALE
RIMANI AL TOP

Le migliori analisi sul mondo delle criptovalute, direttamente nella tua casella di posta.

Tencent svela il modello di ragionamento T1 mentre la corsa all'intelligenza artificiale si intensifica in Cina

DiNelius IreneNelius Irene
Tempo di lettura: 2 minuti.
Tencent svela il modello di ragionamento T1 mentre in Cina si intensifica la corsa all'intelligenza artificiale.
  • Tencent ha lanciato Hunyuan T1 per competere con R1 di DeepSeek.
  • T1 ha ottenuto ottimi risultati nei benchmark AI, superando DeepSeek-R1 in alcuni test.
  • Tencent utilizza sia i propri modelli di intelligenza artificiale sia R1 di DeepSeek nella sua piattaforma cloud.

Tencent Holdings ha introdotto un nuovo modello di ragionamento basato sull'intelligenza artificiale (IA), Hunyuan T1, progettato per competere con R1 di DeepSeek sia in termini di prestazioni che di convenienza.

Presentato venerdì, T1 sfrutta l'apprendimento per rinforzo su larga scala, la stessa tecnica utilizzata da DeepSeek nel suo modello R1 lanciato a gennaio

T1 dimostra prestazionitronin tutti i benchmark

Il rilascio ufficiale segue un beta test dell'anteprima di T1 sul chatbot Yuanbao di Tencent. Il modello ha ottenuto 87,2 punti nel benchmark Massive Multitask Language Understanding (MMLU) Pro, superando gli 84 punti di DeepSeek-R1 ma rimanendo al di sotto di o1 di OpenAI, che ha ottenuto 89,3.

T1 ha ottenutotronrisultati anche in altre valutazioni, ottenendo un punteggio di 78,2 nell'American InvitationalmaticExamination (AIME) del 2024, rispetto al 79,8 di R1 e al 79,2 di o1. Secondo Tencent, ha eccelso nella conoscenza della lingua cinese, ottenendo 91,8 punti nella suite C-Eval, eguagliando R1 e superando gli 87,8 di o1.

Il modello Tencent rivaleggia con DeepSeek in termini di prezzo, il che rappresenta un vantaggio fondamentale per la popolare startup cinese. T1 addebita 1 yuan (0,14 dollari) per 1 milione di token di input, mentre l'output costa 4 yuan per milione di token.

Il tasso di input è in linea con R1, che applica 1 yuan per milione di token durante il giorno e solo 0,25 yuan durante la notte. Anche il prezzo di output è comparabile, dato che la tariffa diurna di R1 è di 16 yuan per milione di token, che scende a 4 yuan durante la notte.

Tencent afferma di essere la prima azienda del settore ad adottare un'architettura ibrida, che include Transformer di Google e un sistema di generazione fornito dalla Carnegie Mellon University e dalla Princeton University, denominato Mamba. Questo riduce significativamente i costi di addestramento e inferenza e ottimizza l'utilizzo della memoria durante l'addestramento rispetto a un'architettura completamente basata su Transformer, afferma l'azienda.

L'azienda promuove T1 come "un sistema che riduce significativamente il consumo di risorse, garantendo al contempo la capacità di catturare informazioni di testo lunghe", consentendo velocità di decodifica più rapide del 200%.

Un ex esperto di big data di JD.com ha scritto il blog tecnologico NCJRYDS e ha testato T1 e R1 sugli stessi compiti. Ha poi chiesto ad altri modelli linguistici di grandi dimensioni, tra cui Claude di Anthropic e ChatGPT di OpenAI, di valutare i risultati.

Il modello di Tencent ha perso il duello nella scrittura di un'antica poesia cinese, ma ha battuto DeepSeek nell'interpretazione di una parola cinese in contesti diversi.

Un altro blog, GoPlayAI, ha sottoposto al modello Tencent quattromatice, dopo averci dedicato cinque minuti, ha sbagliato quella più difficile.

Tencent amplia la sua strategia AI con un approccio dual-core

Tencent, che gestisce la più grande app di social media cinese, WeChat, e la più grande azienda di videogiochi al mondo per fatturato, sta posizionando l'intelligenza artificiale come nuova fonte di reddito principale. L'azienda ha integrato DeepSeek-R1 nella sua piattaforma cloud e nel chatbot Yuanbao, offrendo un'alternativa ai propri modelli Hunyuan.

Il presidente e CEO di Tencent, Pony Ma Huateng, ha recentemente dichiarato di avere grande rispetto per DeepSeek per aver creato "un prodottodent, veramente open source e gratuito".

Ma ha affermato che Tencent ha adottato una strategia "doppio core" sull'intelligenza artificiale, che utilizza sia DeepSeek sia i propri modelli Yuanbao. Questo approccio è simile a quello con cui ha dominato l'industria dei videogiochi, promuovendo titoli sviluppati internamente e quelli di studident .

Le menti più brillanti del mondo delle criptovalute leggono già la nostra newsletter. Vuoi partecipare? Unisciti a loro.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza finanziaria. Cryptopolitandi declina ogni responsabilità per gli investimenti effettuati sulla base delle informazioni contenute in questa pagina. Raccomandiamotrondentdentdentdentdentdentdentdent e/o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

ALTRE NOTIZIE
INTENSIVO CRIPTOVALUTE
CORSO