Un enfoque de entrenamiento revolucionario permite a la IA generalizar como las mentes humanas

Por

Brian Koome

3 minutos de lectura 26 de octubre de 2023

Un nuevo entrenamiento mejora el razonamiento de la IA de manera similar a la humana.
La educación enfocada en IA impulsa la generalización.
Modelos pequeños, grandes avances en IA.

En un avance revolucionario en el campo de la inteligencia artificial (IA), investigadores han presentado un novedoso protocolo de entrenamiento que puede mejorar significativamente la capacidad de un modelo de IA para generalizar y comprender información, acercándolo a la forma en que aprendemos y razonamos los humanos. Este enfoque innovador desafía la creencia convencional de que más datos son la clave para mejorar el aprendizaje automático, ofreciendo nuevos conocimientos sobre los secretos de la IA y la cognición humana.

Los humanos destacamos en la comprensión y combinación de diversos componentes para comprender el mundo, una habilidad cognitiva conocida como "composicionalidad" o "generalizaciónmatic ". Nos permite decodificar oraciones desconocidas, crear respuestas originales y comprender el significado subyacente de las palabras y las reglas gramaticales. Lograr la composicionalidad ha sido durante mucho tiempo un desafío para los desarrolladores de IA, ya que las redes neuronales tradicionales tienen dificultades para emular este aspecto fundamental de la cognición humana.

Si bien los modelos de IA generativa actuales, como GPT-3 y GPT-4 de OpenAI, pueden imitar la composicionalidad hasta cierto punto, a menudo presentan deficiencias en ciertos parámetros, al no comprender plenamente el significado y la intención de las oraciones que generan. Sin embargo, un estudio reciente publicado en Nature sugiere que un protocolo de entrenamiento único, centrado en el aprendizaje de las redes neuronales, podría ser la clave para abordar este desafío.

Reformulando el proceso de aprendizaje

Los autores del estudio adoptaron un enfoque diferente para entrenar la IA, evitando la necesidad de crear arquitecturas de IA completamente nuevas. En cambio, partieron de un modelo transformador estándar, la misma arquitectura fundamental utilizada en ChatGPT y Bard de Google, pero sin ningún entrenamiento previo con texto. La innovación crucial residió en el propio método de entrenamiento.

Los investigadores diseñaron un conjunto de tareas que incluían un lenguaje ficticio compuesto por palabras sin sentido como "dax", "lug", "kiki", "fep" y "blicket". Estas palabras se asociaron con conjuntos de puntos de colores; algunas representaban directamente colores específicos de puntos y otras indicaban funciones que alteraban la salida de los puntos. Por ejemplo, "dax" representaba un punto rojo, mientras que "fep" era una función que, al combinarse con "dax" u otras palabras simbólicas, multiplicaba por tres la salida del punto correspondiente. Fundamentalmente, la IA no recibió información sobre estas asociaciones; los investigadores simplemente proporcionaron ejemplos de oraciones sin sentido junto con las configuraciones de puntos correspondientes.

IA logrando una comprensión similar a la humana

A medida que el modelo de IA se entrenaba, aprendió gradualmente a responder coherentemente, adhiriéndose a las reglas implícitas del lenguaje sin sentido. Incluso al presentarle combinaciones de palabras novedosas, la IA demostró su capacidad para "comprender" las reglas inventadas del lenguaje y aplicarlas a frases nunca antes vistas. Esta notable hazaña insinuó el potencial de la IA para generalizar, un paso crucial hacia un razonamiento similar al humano.

Para evaluar el rendimiento de la IA, los investigadores la compararon con participantes humanos. En algunos casos, la IA entrenada respondió con un 100 % de precisión, superando a los humanos, quienes alcanzaron una tasa de precisión de aproximadamente el 81 %. Incluso cuando la IA cometió errores, estos replicaron errores comunes en los humanos, lo que pone de relieve su capacidad de razonamiento similar al humano.

Lo que es particularmente destacable es que este impresionante rendimiento se logró con un modelo de transformador relativamente pequeño, no con una IA masiva entrenada con grandes conjuntos de datos. Este hallazgo sugiere que, en lugar de saturar los modelos de aprendizaje automático con datos incontables, un enfoque más específico, similar a una clase especializada de lingüística o álgebra, podría generar mejoras sustanciales en las capacidades de la IA.

Implicaciones y direcciones futuras

Si bien este novedoso protocolo de entrenamiento ofrece resultados prometedores, es fundamental reconocer sus limitaciones. El modelo de IA destacó en tareas específicas relacionadas con el reconocimiento de patrones dentro de un lenguaje inventado, pero tuvo dificultades al enfrentarse a desafíos completamente nuevos o formas de generalización inéditas. Por consiguiente, es crucial reconocer que lograr una generalización limitada en IA es un paso significativo, pero no alcanza el objetivo final de la inteligencia artificial general.

Armando Solar-Lezama, informático del Instituto Tecnológico de Massachusetts (MIT), señala que esta investigación podría abrir nuevas vías para mejorar la IA. Al centrarnos en enseñar a los modelos a razonar eficazmente, incluso en tareas sintéticas, podríamos encontrar maneras de mejorar las capacidades de la IA más allá de los límites actuales. Sin embargo, ampliar este nuevo protocolo de entrenamiento podría presentar desafíos que deben abordarse.

Además de sus implicaciones prácticas para la IA, esta investigación también podría arrojar luz sobre el funcionamiento interno de las redes neuronales y sus capacidades emergentes. Comprender estos procesos podría contribuir a minimizar errores en los sistemas de IA y mejorar nuestra comprensión de la cognición humana.

No te limites a leer noticias sobre criptomonedas. Entiéndelas. Suscríbete a nuestro boletín. Es gratis.

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Brian Koome

Brian Koome cuenta con más de siete años de experiencia en periodismo sobre blockchain y criptomonedas, y ha estado activo en el sector desde 2017. Ha colaborado con publicaciones destacadas, como BlockToday.com. Además, desarrolló el curso Ethereum 101 para BitDegree.org antes de unirse Cryptopolitan como redactor a tiempo completo. Brian se especializa en guías permanentes, análisis en profundidad, entrevistas y análisis de precios. Su enfoque en DeFi, la innovación blockchain y los proyectos emergentes de criptomonedas resulta muy atractivo para los lectores.

ÍNDICE

1. Reformulando el proceso de aprendizaje

2. IA logrando una comprensión similar a la humana

3. Implicaciones y direcciones futuras

Comparte este artículo