Ricercatori cinesi svelano una svolta nella compressione LLM

Glory Kaburu

Tempo di lettura: 2 minuti. 17 marzo 2024.

I ricercatori cinesi presentano ShortGPT, un nuovo sistema di compressione per LLM che supera i precedenti metodi di potatura senza ulteriore formazione.

ShortGPT risolve i limiti hardware riducendo i parametri e i calcoli senza compromettere le prestazioni del modello.

La Cina accoglie con favore l'adozione dell'intelligenza artificiale, implementando al contempo rigide normative e misure di controllo per prevenirne l'abuso nel contesto di una guerra fredda tecnologica in atto.

Ricercatori cinesi hanno introdotto una tecnica di compressione rivoluzionaria volta ad affrontare i vincoli hardware associati all'implementazione di modelli linguistici di grandi dimensioni (LLM). Questo nuovo approccio, denominato ShortGPT, è stato sviluppato da esperti di Baichuan Inc. e del Chinese Information Processing Laboratory Institute of Software, Accademia Cinese delle Scienze. Il metodo si basa su tecniche di pruning esistenti, offrendo una soluzione per mitigare i costi di inferenza degli LLM senza richiedere ulteriore formazione.

Rivoluzionare la compressione dei modelli

Il metodo ShortGPT introduce una nuova metrica nota come Block Influence (BI) per valutare le trasformazioni di stato nascoste all'interno dei LLM. Utilizzando i punteggi BI, il sistemadented elimina i parametri ridondanti, ottimizzando così il modello per l'implementazione su hardware con risorse limitate. Questo approccio prevede la potatura dei livelli in base al loro impatto sulle prestazioni del modello, garantendo che vengano mantenuti solo i componenti essenziali.

Esperimenti approfonditi hanno dimostrato la superiorità di ShortGPT rispetto ai metodi di potatura allo stato dell'arte (SOTA) esistenti. A differenza degli approcci convenzionali che spesso si basano su metodi di quantizzazione, ShortGPT opera in mododent, consentendo una significativa riduzione dei parametri e un'efficienza computazionale senza compromettere la precisione del modello. Questa innovazione sottolinea la notevole ridondanza all'interno delle architetture LLM e mette in mostra il potenziale per tecniche di compressione semplificate.

Le ambizioni della Cina in materia di intelligenza artificiale

Negli ultimi anni, la Cina ha adottato un atteggiamento positivo nei confronti dell'adozione dell'intelligenza artificiale, per tenere il passo con il ritmo dell'innovazione negli Stati Uniti e in Europa. Il Paese sta attivamente migliorando le capacità dei fornitori locali di servizi di intelligenza artificiale, tecnologia blockchain e calcolo quantistico, nel bel mezzo di una guerra fredda in corso con gli Stati Uniti.

Nonostante la posizione lungimirante, le autorità cinesi sono desiderose di prevenire l'uso improprio dell'IA attraverso l'introduzione di normative severe e tattiche di controllo severe. L'ecosistema dell'IA nella Cina continentale è un alveare di attività, sottolineato da una avalanche di lanci commerciali di offerte di IA generativa da parte di aziende tecnologiche.

L'introduzione di ShortGPT rappresenta una pietra miliare significativa nel campo della compressione dell'intelligenza artificiale, promettendo maggiore efficienza e prestazioni per modelli linguistici di grandi dimensioni. Mentre la Cina continua a guidare l'innovazione nell'intelligenza artificiale, i suoi investimenti strategici e le iniziative di ricerca posizionano il Paese come un attore di rilievo nel panorama tecnologico globale.

Non limitarti a leggere le notizie sulle criptovalute. Cerca di capirle. Iscriviti alla nostra newsletter. È gratis.

Condividi questo articolo

Disclaimer. Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan/ non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamotronvivamente di effettuare ricerche indipendentident di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

Glory Kaburu

Glory è una giornalista estremamente competente, esperta di strumenti e ricerche di intelligenza artificiale. È appassionata di intelligenza artificiale e ha scritto diversi articoli sull'argomento. Si tiene aggiornata sugli ultimi sviluppi in materia di intelligenza artificiale, apprendimento automatico e apprendimento profondo, scrivendo regolarmente sull'argomento.

INDICE

1. Rivoluzionare la compressione dei modelli

2. Le ambizioni della Cina in materia di intelligenza artificiale

Condividi questo articolo