ÚLTIMAS NOTICIAS
SELECCIONADO PARA TI
SEMANALMENTE
MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

¿Qué es la generación aumentada por recuperación o RAG?

PorAamir SheikhAamir Sheikh
3 minutos de lectura
Recuperación-Generación Aumentada
  • La generación aumentada por recuperación es un proceso de obtención de datos de fuentes externas.
  • Se utiliza para basar los LLM en bases de conocimiento actuales y auténticas y proporciona acceso a los usuarios para verificación cruzada.
  • RAG es útil para reducir los costos de entrenamiento de los modelos de IA, ya que reduce la necesidad de entrenamiento continuo.

La precisión y confiabilidad de los modelos de IA generativos se pueden mejorar con datos obtenidos de fuentes externas, y la técnica utilizada para obtenerlos se denomina generación aumentada por recuperación (RAG).

Para simplificar la comprensión, supongamos que un buen modelo de lenguaje extenso (LLM) puede responder a una amplia gama de consultas humanas. Sin embargo, para obtener respuestas creíbles, debe incluir fuentes citadas, y para ello, debe investigar, por lo que el modelo necesitará un asistente. Este proceso de asistencia se denomina generación aumentada por recuperación (RAG, por sus siglas en inglés) para mayor facilidad.

Comprender la generación aumentada por recuperación, o RAG

Para comprender mejor el RAG, este cubre las lagunas existentes en las obras de LLM. La calidad o la eficacia de un LLM se mide por la cantidad de parámetros que contiene. Los parámetros son básicamente los patrones generales de cómo los humanos usamos las palabras para formar oraciones. Los LLM pueden ser inconsistentes con las respuestas que ofrecen. 

A veces proporcionan la información exacta que el usuario necesita, y otras veces simplemente extraen datos y cifras aleatorios de los conjuntos de datos incluidos en su entrenamiento. Si a veces los LLM dan respuestas vagas, como si no supieran lo que dicen, es porque realmente no tienen idea de lo que dicen. Como mencionamos anteriormente sobre los parámetros, los LLM pueden relacionar palabras estadísticamente, pero desconocen su significado.

La integración de RAG en sistemas de chat basados ​​en LLM tiene dos beneficios principales: garantiza que el modelo pueda acceder a hechos actuales y confiables, y también garantiza que los usuarios puedan verificar que sus afirmaciones son confiables ya que tienen acceso a las fuentes del modelo.

El director de Tecnologías del Lenguaje de IBM Research, Luis Lastras, afirmó:

“Quieres cruzar las respuestas de un modelo con el contenido original para poder ver en qué se basa su respuesta”

Fuente: IBM.

Además, ofrece otras ventajas, como la reducción de las posibilidades de alucinaciones y fugas de datos, ya que puede basar su conocimiento en fuentes externas, evitando así depender únicamente de los datos con los que fue entrenado. RAG también reduce los costos financieros y computacionales de ejecutar chatbots, ya que requiere menos entrenamiento con nuevos datos.

Beneficios de RAG

Tradicionalmente, los modelos de conversación digital utilizaban un enfoque de diálogo manual. Comprendían la intención del usuario, extraían la información basándose en ella y proporcionaban respuestas según un guion general ya defipor los programadores. Este sistema era capaz de responder preguntas sencillas y directas. Sin embargo, presentaba limitaciones.

Responder a cada consulta que un cliente pudiera plantear requería mucho tiempo; si el usuario se saltaba un paso, el chatbot carecía de la capacidad para gestionar la situación e improvisar. Sin embargo, la tecnología actual ha hecho posible que los chatbots proporcionen respuestas personalizadas a los usuarios sin necesidad de que los humanos escriban nuevos scripts, y RAG va un paso más allá al mantener el modelo con contenido actualizado y reducir la necesidad de capacitación. Como dijo Lastras:

Piense en el modelo como un empleado junior demasiado entusiasta que responde bruscamente sin comprobar los hechos. La experiencia nos enseña a detenernos y decir algo cuando no sabemos algo. Pero los LLM necesitan una formación específica para reconocer las preguntas que no pueden responder

Fuente: IBM.

Como sabemos, las preguntas de los usuarios no siempre son directas; pueden ser complejas, vagas y extensas, o requerir información que el modelo no posee o no puede analizar fácilmente. En tales casos, los modelos de lógica difusa pueden generar errores. El ajuste fino puede prevenir estas situaciones, y los modelos pueden entrenarse para detenerse ante tales circunstancias. Sin embargo, necesitarán miles de ejemplos de preguntas similares para poder reconocerlas. 

RAG es el mejor modelo disponible actualmente para basar los LLM en los datos más recientes y confirmables, además de reducir el tiempo de entrenamiento. RAG también está evolucionando con el tiempo y aún requiere más investigación para corregir imperfecciones.

No te limites a leer noticias sobre criptomonedas. Entiéndelas. Suscríbete a nuestro boletín. Es gratis.

Comparte este artículo

Descargo de responsabilidad: La información proporcionada no constituye asesoramiento financiero. Cryptopolitanno se responsabiliza de las inversiones realizadas con base en la información de esta página. Recomendamostronencarecidamente realizar una investigación independientedent o consultar con un profesional cualificado antes de tomar cualquier decisión de inversión.

Aamir Sheikh

Aamir Sheikh

Aamir es periodista especializado en tecnología con casi seis años de experiencia en los sectores de criptomonedas y tecnología. Se graduó de la Universidad MAJ con un MBA en Finanzas y Marketing. Actualmente trabaja en Cryptopolitan, donde informa sobre las últimas novedades en los mercados de criptomonedas y realiza predicciones de precios.

MÁS… NOTICIAS
CURSO INTENSIVO DE CRIPTOMONEDAS PROFUNDAS