Your bank is using your money. You’re getting the scraps.WATCH FREE

Che cosa è la generazione aumentata dal recupero, o RAG?

In questo post:

  • La generazione aumentata dal recupero è un processo di recupero di fatti da fonti esterne.
  • Viene utilizzato per basare gli LLM sulle basi di conoscenza attuali e autentiche e fornisce agli utenti l'accesso per la verifica incrociata.
  • RAG è utile per ridurre i costi di formazione dei modelli di intelligenza artificiale poiché riduce la necessità di formazione continua.

L'accuratezza e l'affidabilità dei modelli di intelligenza artificiale generativa possono essere migliorate grazie ai dati ottenuti da fonti esterne; la tecnica utilizzata per recuperarli è chiamata generazione aumentata dal recupero (RAG).

Per semplificare, supponiamo che un buon modello linguistico di grandi dimensioni (LLM) possa rispondere a un'ampia gamma di interrogativi umani. Tuttavia, per ottenere risposte credibili, è necessario che in esso siano citate alcune fonti e, a tal fine, è necessario effettuare delle ricerche, quindi il modello avrà bisogno di un assistente. Questo processo di assistenza è chiamato generazione aumentata dal recupero, o RAG, per semplicità.

Comprensione della generazione aumentata dal recupero, o RAG

Per comprendere meglio il RAG, esso colma le lacune già presenti nei lavori degli LLM. La qualità o la potenza di un LLM si misurano in base al numero di parametri che possiede. I parametri sono fondamentalmente gli schemi generali di come noi umani usiamo le parole per costruire frasi. Gli LLM possono essere incoerenti con le risposte che forniscono. 

A volte forniscono le informazioni esatte di cui l'utente ha bisogno, altre volte si limitano a sfornare dati e cifre casuali dai set di dati inclusi nel loro training. Se a volte gli LLM forniscono risposte vaghe, come se non sapessero cosa stanno dicendo, è perché in realtà non ne hanno idea. Come abbiamo detto sopra sui parametri, gli LLM possono correlare statisticamente le parole, ma non ne conoscono il significato.

Vedi anche  Fairgame$ presumibilmente ritardato a causa dell'addio del fondatore di Haven Studios, Jade Raymond

L'integrazione di RAG nei sistemi di chat basati su LLM presenta due vantaggi principali: garantisce che il modello possa accedere a fatti attuali e affidabili e garantisce inoltre che gli utenti possano verificare che le sue affermazioni siano affidabili poiché hanno accesso alle fonti del modello.

Il direttore delle tecnologie linguistiche presso IBM Research, Luis Lastras, ha affermato:

"È necessario confrontare le risposte di un modello con il contenuto originale, in modo da poter vedere su cosa si basa la sua risposta."

Fonte: IBM .

Ci sono anche altri vantaggi, in quanto riduce il rischio di allucinazioni e perdite di dati, avendo la possibilità di basare le proprie conoscenze su fonti esterne, quindi non deve affidarsi esclusivamente ai dati su cui è stato addestrato. RAG riduce anche i costi finanziari e computazionali di gestione dei chatbot, poiché ha meno bisogno di essere addestrato su nuovi dati.

Vantaggi del RAG

Tradizionalmente, i modelli di conversazione digitale utilizzavano un approccio dialogico manuale. Stabilivano la comprensione dell'intento dell'utente, quindi estraevano le informazioni su questa base e fornivano risposte in uno script generale già defidai programmatori. Questo sistema era in grado di rispondere a domande semplici e dirette. Tuttavia, presentava dei limiti.

Fornire risposte a ogni domanda che un cliente avrebbe potuto porre richiedeva molto tempo; se l'utente saltava un passaggio, il chatbot non era in grado di gestire la situazione e improvvisare. Tuttavia, la tecnologia odierna ha permesso ai chatbot di fornire risposte personalizzate agli utenti senza la necessità di scrivere nuovi script da parte degli esseri umani, e RAG fa un ulteriore passo avanti mantenendo il modello sui contenuti nuovi e riducendo la necessità di formazione. Come ha affermato Lastras,

"Pensate al modello come a un impiegato junior troppo zelante che spara una risposta prima di verificare i fatti. L'esperienza ci insegna a fermarci e a dire quando non sappiamo qualcosa. Ma gli LLM devono essere formati in modo esplicito per riconoscere le domande a cui non sanno rispondere."

Fonte: IBM.

Come sappiamo, le domande degli utenti non sono sempre semplici, possono essere complesse, vaghe e prolisse, oppure richiedono informazioni che il modello non possiede o non riesce a sviscerare facilmente. In tali condizioni, i LLM possono avere allucinazioni. La messa a punto può prevenire questi casi e i LLM possono essere addestrati a fermarsi quando si trovano in una situazione del genere. Ma sarà necessario fornire migliaia di esempi di tali domande per riconoscerle.

Vedi anche  Meta rilascia strumenti di intelligenza artificiale, tra cui uno che verifica l'accuratezza di altri modelli di intelligenza artificiale

RAG è il miglior modello attualmente disponibile per basare gli LLM sui dati più recenti e verificabili e ridurre la formazione. RAG si sta sviluppando nel tempo e necessita ancora di ulteriori ricerche per eliminarne le imperfezioni.

Continui a lasciare che la banca si tenga la parte migliore? Guarda il nostro video gratuito su come diventare la tua banca .

Condividi link:

Disclaimer:  Le informazioni fornite non costituiscono consulenza di trading. Cryptopolitan non si assume alcuna responsabilità per gli investimenti effettuati sulla base delle informazioni fornite in questa pagina. Consigliamo vivamente di effettuare ricerche indipendenti tron dent o di consultare un professionista qualificato prima di prendere qualsiasi decisione di investimento.

I più letti

Caricamento degli articoli più letti...

Rimani aggiornato sulle novità in ambito criptovalute, ricevi aggiornamenti giornalieri nella tua casella di posta

Scelta dell'editore

Caricamento degli articoli scelti dall'editore...

- La newsletter Crypto che ti tiene al passo -

I mercati si muovono velocemente.

Ci muoviamo più velocemente.

Iscriviti a Cryptopolitan Daily e ricevi direttamente nella tua casella di posta elettronica informazioni tempestive, pertinenti e pertinenti sulle criptovalute.

Iscriviti subito e
non perderti nemmeno una mossa.

Entra. Scopri i fatti.
Vai avanti.

Iscriviti a CryptoPolitan