Investigadores de Stanford y la Universidad de Washington crean un rival de código abierto de ChatGPT o1 de 50 dólares

Por

Jai Hamid

3 minutos de lectura 6 de febrero de 2025

Stanford y la Universidad de Washington construyeron un modelo de IA llamado s1 por solo 50 dólares, rivalizando con el o1 de OpenAI en pruebas de matemáticas, lógica y codificación.
El equipo utilizó el modelo Gemini 2.0 de Google a través de un método de entrenamiento económico llamado destilación y compartió todo en código abierto en GitHub.
Los grandes actores como OpenAI no están contentos y temen que las réplicas de bajo costo puedan interrumpir sus inversiones de miles de millones de dólares.

Los investigadores de IA de Stanford y la Universidad de Washington supuestamente lograron lo que nadie creía posible: crearon un modelo de IA llamado s1 por menos de 50 dólares en créditos de computación en la nube, según un informe de investigación publicado el lunes.

el modelo s1 ofrece un desempeño comparable al de los mejores modelos de razonamiento, incluidos o1 de OpenAI y R1 de DeepSeek. Y lo que es aún mejor, todo el proyecto está disponible en GitHub: código, datos y todo lo demás.

El equipo comenzó adoptando un modelo estándar en lugar de crear uno nuevo. A partir de ahí, lo perfeccionaron mediante un proceso llamado destilación. Según su investigación, extrajeron el poder de razonamiento del modelo experimental Gemini 2.0 Flash Thinking de Google.

Entrenaron a s1 para imitar las técnicas de resolución de problemas de Gemini, aprendiendo de sus respuestas. «Buscamos la simplicidad», afirmó Niklas Muennighoff, uno de los investigadores de Stanford que participaron.

Pequeño conjunto de datos, grandes resultados

La destilación se está convirtiendo rápidamente en una herramienta predilecta para los equipos de IA que buscan reducir costos. Un modelo de IA similar, desarrollado el mes pasado por investigadores de Berkeley, costó $450 para entrenar, un precio aún bajo para los estándares de la industria. Pero Stanford y la Universidad de Washington fueron un paso más allá, reduciendo los costos a aproximadamente $50 al destilar su modelo con un conjunto de datos más pequeño y técnicas optimizadas.

Los investigadores seleccionaron cuidadosamente solo 1000 preguntas, cada una con respuestas detalladas y razonamiento paso a paso de Gemini 2.0 de Google. Este conjunto de datos proporcionó todo el conocimiento que s1 necesitaba para un rendimiento óptimo. Según el artículo del equipo, el modelo aprendió a analizar los problemas.

El ajuste fino supervisado, o SFT, fue clave para que esto funcionara. En lugar de usar aprendizaje por refuerzo, que requiere enormes conjuntos de datos y una gran capacidad de procesamiento, los investigadores optaron por SFT, un método en el que la IA se entrena directamente para imitar los comportamientos encontrados en el conjunto de datos. Es más económico y rápido, y en este caso, funcionó.

El modelo base provino de Qwen, el laboratorio de IA de Alibaba. Su modelo estándar se podía descargar gratis, lo que hizo que el proyecto fuera aún más económico. En menos de 30 minutos y con solo 16 GPU Nvidia H100, el equipo terminó de entrenar s1. "Hoy podríamos alquilar el cómputo necesario por unos 20 dólares", dijo Muennighoff.

El comando "Esperar" aumentó la precisión del s1

Según se informa, los investigadores incluyeron un truco ingenioso para mejorar el razonamiento de s1: añadieron la palabra "esperar" durante la resolución de problemas. Al indicarle al modelo que hiciera una pausa y revisara su trabajo, aumentaron la precisión. El artículo de investigación detalla cómo esta modificación le dio a s1 tiempo suficiente para considerar mejores respuestas antes de enviarlas.

OpenAI observa de cerca. Ya han acusado a DeepSeek de recopilar datos indebidamente de su API para crear competidores de IA. Con s1 demostrando lo barata que puede ser la replicación, grandes empresas como OpenAI no están entusiasmadas. La mercantilización de los modelos de IA podría perjudicar sus resultados.

Pero la empresa tecnológica tiene otros problemas. El martes, el equipo legal de Elon Musk se enfrentó a OpenAI en un tribunal federal de Oakland. Elon, quien fue uno de los primeros inversores en OpenAI, afirma que la empresa abandonó su misión sin fines de lucro y traicionó sus objetivos originales.

Está demandando para bloquear su transición a una empresa totalmente lucrativa. El abogado de Elon, Marc Toberoff, declaró ante el tribunal el viernes que Elon invirtió 45 millones de dólares en OpenAI entre su fundación y 2018 porque creía que siempre priorizaría el beneficio público sobre las ganancias, tal como prometió al principio.

La jueza Yvonne Gonzalez Rogers lo calificó de "exagerado" y cuestionó por qué Elon invertiría tanto dinero sin untracescrito. "Eso es mucho dinero en un apretón de manos", se burló. El abogado Toberoff explicó entonces que Elon y el director ejecutivo de OpenAI, Sam Altman, tenían una estrecha relación en aquel momento, y que todo se basaba en la confianza.

Pero el caso aún no está cerrado. Al juez le preocupa la estrecha relación de OpenAI con Microsoft. Dos figuras clave —el cofundador de LinkedIn, Reid Hoffman, y la ejecutiva de Microsoft, Deanna Templeton— formaban parte de la junta directiva de OpenAI. Templeton fue incorporada como miembro sin derecho a voto tras la breve destitución de Altman en 2023, pero posteriormente fue destituida por motivos antimonopolio.

Elon quiere detener sus planes y potencialmente obtener mayor control sobre la compañía a través de su propia empresa de inteligencia artificial, xAI, a la que se sumó como demandante en el caso. OpenAI argumenta que la solicitud de Elonripple su negocio y se basa en afirmaciones inverosímiles.

Si estás leyendo esto, ya llevas ventaja. Mantente al día con nuestro boletín informativo.

ChatGPT Géminis OpenAI

Comparte este artículo

Aviso legal. La información proporcionada no constituye asesoramiento comercial. Cryptopolitanconsultar no se responsabiliza de las inversiones realizadas con base en la información proporcionada en esta página. Recomendamostronencarecidamente realizar una investigación independientedent un profesional cualificado antes de tomar cualquier decisión de inversión.

Jai Hamid

Jai Hamid lleva seis años cubriendo temas de criptomonedas, mercados bursátiles, tecnología, economía global y eventos geopolíticos que afectan a los mercados. Ha colaborado con publicaciones especializadas en blockchain, como AMB Crypto, Coin Edition y CryptoTale, en análisis de mercado, grandes empresas, regulación y tendencias macroeconómicas. Estudió en la London School of Journalism y ha compartido en tres ocasiones sus perspectivas sobre el mercado de criptomonedas en una de las principales cadenas de televisión de África.

ÍNDICE

1. Pequeño conjunto de datos, grandes resultados

2. El comando "Esperar" aumentó la precisión del s1

Comparte este artículo