ÚLTIMAS NOTICIAS

vivir EN DIRECTO: La Reserva Federal mantiene los tipos de interés sin cambios en la primera reunión de Kevin Warsh

Actualizaciones en vivo del 17 de junio de 2026
Los líderes del G7 piden una ofensiva coordinada contra la maquinaria de robo de criptomonedas de Corea del Norte

Hace 8 minutos Noticias
¿Por qué se están desplomando ahora las acciones de SpaceX?

Hace 27 minutos Tecnología
Microsoft toma la delantera rápidamente mientras la competencia evita el pujante mercado chino de IA

Hace 2 horas Tecnología

SELECCIONADO PARA TI

SEMANALMENTE

MANTÉNGASE EN LA CIMA

Los mejores análisis sobre criptomonedas directamente en tu bandeja de entrada.

Los modelos de IA dominan capacidades mucho antes de exhibirlas, según muestra una investigación

Por

Owotunse Adebayo

3 minutos de lectura 24 de noviembre de 2024

Los modelos de IA dominan las capacidades mucho antes de exhibirlas, según muestra una investigación

Las investigaciones han demostrado que los modelos de IA dominan las capacidades mucho antes de exhibirlas.
Los investigadores afirman que los modelos pueden internalizar conceptos mucho antes de exhibirlos.
Los investigadores revelan diferentes métodos para revelar capacidades ocultas.

Una nueva investigación ha demostrado que los modelos de inteligencia artificial (IA) poseen ciertas capacidades mucho antes de exhibirlas durante el entrenamiento. Según la investigación realizada por Harvard y la Universidad de Michigan, los modelos no muestran estas capacidades hasta que, de una forma u otra, las necesitan.

La investigación es una de las muchas que se han llevado a cabo para comprender cómo los modelos de IA desarrollan sus capacidades antes de mostrarlas.

El estudio analizó cómo los modelos de IA aprenden conceptos básicos como el tamaño y el color, revelando que dominan estas habilidades antes de lo que sugieren la mayoría de las pruebas. El estudio también aportó información sobre la complejidad de medir las capacidades de una IA. «Un modelo puede parecer incompetente al recibir instrucciones estándar, cuando en realidad posee habilidades sofisticadas que solo se manifiestan en condiciones específicas», se lee en el documento.

La investigación muestra que los modelos de IA internalizan conceptos

Harvard y la Universidad de Michigan no son las primeras en intentar comprender las capacidades de los modelos de IA. Investigadores de Anthropic presentaron un artículo titulado "Aprendizaje de diccionario". El artículo abordaba la identificación de conexiones en el lenguaje Claude con conceptos específicos que este comprende. Si bien la mayoría de estas investigaciones adoptaron diferentes enfoques, su objetivo principal era comprender los modelos de IA.

Anthropic reveló que encontró características que podrían vincularse a diferentes conceptos interpretables. "Encontramos millones de características que parecen corresponder a conceptos interpretables, desde objetos concretos como personas, países y edificios famosos hasta ideastraccomo emociones, estilos de escritura y pasos de razonamiento", reveló la investigación.

Durante su investigación, los investigadores realizaron varios experimentos utilizando el modelo de difusión, una de las arquitecturas más populares para la IA. Durante el experimento, se dieron cuenta de que los modelos tenían distintas maneras de manipular conceptos básicos. Los patrones fueron consistentes, ya que los modelos de IA mostraron nuevas capacidades en diferentes fases y un punto de transición preciso que indicaba la adquisición de una nueva habilidad.

Durante el entrenamiento, los modelos demostraron dominar conceptos unos 2000 pasos antes de lo que detectaría una prueba estándar. Los conceptos mástronaparecieron alrededor de los 6000 pasos y los menos sólidos, alrededor de los 20 000. Tras ajustar las señales conceptuales, se descubrió una correlación directa con la velocidad de aprendizaje.

Investigadores revelan métodos para acceder a capacidades ocultas

Los investigadores utilizaron métodos alternativos de estimulación para revelar capacidades ocultas antes de que se manifestaran en pruebas estándar. La naturaleza desenfrenada de la emergencia oculta afecta la evaluación y la seguridad de la IA. Por ejemplo, los puntos de referencia tradicionales pueden pasar por alto ciertas capacidades de los modelos de IA, pasando por alto tanto las beneficiosas como las preocupantes.

Durante la investigación, el equipo ideó métodos para acceder a las capacidades ocultas de los modelos de IA. La investigación denominó estos métodos intervención latente lineal y sobreindicación, ya que los investigadores lograron que los modelos exhibieran comportamientos complejos antes de que se manifestaran en pruebas estándar. También descubrieron que los modelos de IA manipulaban ciertas características complejas antes de poder mostrarlas mediante indicaciones estándar.

Por ejemplo, se podría pedir a los modelos que generaran correctamente "mujeres sonrientes" u "hombres con sombreros" antes de pedirles que los combinaran. Sin embargo, la investigación demostró que ya habían aprendido a combinarlo, pero no podrían demostrarlo mediante indicaciones convencionales. Se puede decir que los modelos que demuestran capacidades están asimilando, una situación en la que los modelos exhiben un rendimiento perfecto en las pruebas después de un entrenamiento prolongado. No obstante, los investigadores señalaron que existen diferencias clave entre ambos.

Si bien la asimilación ocurre tras varias sesiones de entrenamiento e implica el refinamiento de varias distribuciones de los mismos conjuntos de datos, la investigación muestra que estas capacidades surgen durante el aprendizaje activo. Los investigadores observaron que los modelos encontraron nuevas maneras de manipular conceptos mediante cambios en fases, en lugar de mejoras graduales en la representación durante la asimilación.

Según la investigación, los modelos de IA conocen estos conceptos, pero no pueden mostrarlos. Es similar a que las personas vean y comprendan una película extranjera, pero no hablen el idioma. Esto demuestra que la mayoría de los modelos tienen más capacidades de las que demuestran, y también la dificultad para comprenderlas y controlarlas.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

Estados Unidos

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Owotunse Adebayo

Adebayo es un escritor con cuatro años de experiencia en el sector de las criptomonedas. Se graduó de la Universidad de Lagos, donde estudió Planificación Urbana y Regional. Ha trabajado en Tokenhell y CryptoTicker, escribiendo noticias sobre criptomonedas y tecnología financiera. Actualmente colabora en Cryptopolitan.

ÍNDICE

1. La investigación muestra que los modelos de IA internalizan conceptos

2. Investigadores revelan métodos para acceder a capacidades ocultas

Comparte este artículo

MÁS… NOTICIAS

MOSTRAR TODO

5 ingeniosas aplicaciones de ChatGPT y qué debes hacer al respecto

Hace 3 años, el técnico John Palmer

El 93% de los líderes empresariales prefieren soluciones basadas en IA para la gestión de la sostenibilidad de la marca, según Reuters

Hace 3 años, el técnico John Palmer

El ecosistema de inteligencia artificial de Francia

Así apoya Macron el vibrante y productivo ecosistema de IA de Francia

Hace 3 años Tech Glory Kaburu

Bloomberg estima que el mercado de IA generativa alcanzará los 1,3 billones de dólares en 2032

Hace 3 años, Tech Aamir Sheikh

¿Qué es Base? La red de capa 2 Ethereum lanzada por Coinbase

21 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Dogecoin vs. Bitcoin: Diferencias técnicas clave

20 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es TVL (valor total bloqueado) en criptomonedas?

14 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Cómo leer un documento técnico sobre criptomonedas?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
Ripple vs. XRP vs. XRP Ledger: ¿Cuál es la diferencia?

13 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes
¿Qué es una billetera multifirma en criptomonedas?

10 de octubre de 2025 Aprende sobre criptomonedas: Guías para principiantes

CURSO INTENSIVO DE CRIPTOMONEDAS PROFUNDAS

¿Qué criptomonedas pueden hacerte ganar dinero?
Cómo mejorar tu seguridad con una billetera (y cuáles realmente vale la pena usar)
Estrategias de inversión poco conocidas que utilizan los profesionales
Cómo empezar a invertir en criptomonedas (qué plataformas de intercambio usar, las mejores criptomonedas para comprar, etc.)